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A la poursuite du bonheur 

Perl est un langage qui vous aide a faire votre travail. 

Bien sur, si votre travail consiste a programmer, vous pouvez le faire avec n'importe quel 
langage informatique « complet », du moins en theorie. Mais nous savons par experien- 
ce que les langages informatiques ne different pas tant par ce qu'ils rendent possible que 
par ce qu'ils rendent facile. D'un cote, les langages soi-disants de « quatrieme 
generation » facilitent certaines taches, mais en rendent d'autres quasiment impossi- 
bles. De l'autre cote, certains langages bien connus, « de qualite industrielle », rendent 
a peu pres tout difficile. 

Perl est different. En resume, Perl est concu pour simplifier les taches faciles, sans ren- 
dre les taches difficiles impossibles. 

Et quelles sont ces « taches faciles » qui devraient le rester ? Celles que Ton rencontre 
tous les jours, bien sur. II faut un langage qui facilite la manipulation des nombres, de 
texte, des fichiers et des repertoires, des ordinateurs et des reseaux, et surtout des pro- 
grammes. II devrait etre facile de lancer des programmes externes et de scruter leur sor- 
tie a la recherche d'informations interessantes. II devrait etre facile d'envoyer ces 
informations vers d'autres programmes qui les manipuleront intelligemment. De me- 
me, il devrait etre facile de developper, de modifier et de mettre au point vos propres 
programmes. Et, bien sur, il devrait etre facile de compiler et de lancer ces programmes, 
de les porter facilement, ceci sur n'importe quel systeme d'exploitation moderne. 

Perl fait tout cela, et plus encore. 

Au depart concu comme un langage pour administrer UNIX, Perl a ete porte sur la plu- 
part des systemes d'exploitation. De fait, Perl est l'un des environnements de program- 
mation les plus portables de nos jours. Pour rendre un programme C ou C++ portable, 
il faut y inclure ces etranges balises #ifdef differentes pour chaque systeme cible. Pour 
rendre un programme Java portable, il est necessaire de comprendre toutes les particu- 
larites de chaque nouvelle implementation de Java. Pour porter un script shell il est ne- 
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cessaire de se souvenir de la syntaxe pour chaque version du systeme cible, et ceci pour 
chaque commande, et done de trouver le plus petit denominateur commun, qui avec 
un peu de chances fonctionnera partout. Pour porter un programme ecrit en Visual 
Basic, il faudra alors une definition plus souple du mot portable. : - ) 

Perl, par on ne sait quelle magie, evite de tels problemes en retenant les cotes positifs de 
ces langages. Cette magie a plusieurs sources : Futilite de ces methodes, la creative com- 
munaute Perl et la f loraison du logiciel libre. Mais surtout, cette magie vient de son ca- 
ractere hybride : Perl est un langage metisse et a toujours vu cette diversite non comme 
une faiblesse mais comme une force. Alors, si vous avez envie de gouter a la liberte, Perl 
est fait pour vous. 

Perl n'a pas de frontieres. A Forigine de l'explosion du langage Perl, il y a le desir des 
premiers programmeurs systeme Unix de ne garder que le meilleur de cet « ancien 
monde ». Pour ceux-ci, Perl est une distillation portable de la culture Unix, et une oasis 
dans un desert sans issues. Ce qui est satisfaisant, e'est que Ton peut tout aussi bien re- 
traverser de l'autre cote : les designers de sites web sont heureux de pouvoir faire fonc- 
tionner leurs scripts Perl sans modification sur le serveur de leur societe. 

La raison pour laquelle Perl est si populaire parmi les programmeurs systeme et les de- 
veloppeurs de sites web, e'est tout simplement parce qu'ils Font decouvert en premier ; 
mais Perl aspire a une plus large audience. Depuis ses debuts, comme simple langage 
traducteur d'autres langages, Perl s'est developpe comme un langage sophistique est tres 
general, accompagne d'un systeme de developpement complet avec debogueur, optimi- 
seur, referenceur croise, compilateur, editeur oriente syntaxe et toute une bibliotheque 
de modules en faisant ainsi un veritable langage de programmation. Mais ce qui diffe- 
rencie vraiment Perl, e'est qu'il a toujours su garder une vision simple des choses qui 
Finteressent. 

Sa puissance et son accessibilite le rendent utilisable dans tous les domaines de la con- 
naissance, de Fingenierie spatiale a la biologie moleculaire, des mathematiques a la lin- 
guistique, du graphisme au traitement des documents, de la gestion des bases de 
donnees a celle des reseaux. Perl est utilise pour traiter rapidement une grande quantite 
d'informations, aussi bien des sequences ADN que des pages web. Aussi, l'une des plai- 
santeries de la communaute Perl, est que le prochain crack boursier sera probablement 
declenche par un bogue dans un script Perl. (L'avantage est que les analystes boursiers 
au chomage pourront toujours se reconvertir.) 

II existe de nombreuses raisons au succes de Perl. Le langage Perl fut Fun des premiers 
projets de la communaute du logiciel libre. Perl est libre et le sera toujours. Grace a sa 
licence tres ouverte, vous pouvez Futiliser oil bon vous semble : au travail ou dans des 
applications commerciales, sans restriction et sans redevance. Et s'il survient une diffi- 
culte que la communaute Perl ne peut resoudre, vous disposez en dernier recours du 
code source. Elle n'est pas du genre a vous faire payer des mises a jour. Elle ne mettra 
pas la cle sous la porte en laissant votre programme orphelin. 

Que Perl soit un langage libre Fa surement beaucoup aide. Mais e'est aussi le cas de la 
plupart des logiciels libres qui prosperent. Perl autorise tous ces degres de liberte car 
e'est un langage dont la personnalite est eclatee. II s'agit d'un langage a la fois tres simple 
et tres riche. II a pris de bonnes idees presque partout, et les a implantees dans un cadre 
facile a utiliser. Pour ceux qui Faiment sans plus, Perl est le Practical Extraction and Report 
Language. Pour ceux qui ne jurent que par lui, Perl est le Pathologically Eclectic Rubbish 
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Lister. Pour les minimalistes du lot, Perl ressemble a une demonstration de redondance 
inepte. Pas de probleme. Le monde a besoin de quelques reductionnistes (surtout chez 
les physiciens). Les reductionnistes aiment isoler les choses. Nous, nous essayons de leur 
donner un sens. 

Perl est par bien des aspects un langage simple. Point n'est besoin de connaitre de nom- 
breuses incantations mysterieuses pour compiler un programme Perl ; il suffit de l'exe- 
cuter comme un script shell. Les types et les structures employes par Perl sont faciles a 
utiliser et a comprendre. Perl n'impose pas de limitation arbitraire a vos donnees ; vos 
chaines et vos tableaux peuvent croitre tant qu'ils veulent (tant qu'il reste de la memoi- 
re) et ils sont concus pour s'adapter a leur croissance. Au lieu de vous forcer a apprendre 
de nouvelles syntaxes et de nouveaux concepts, Perl emprunte de nombreuses notions 
a d'autres langages qui peuvent vous etre familiers (comme le C, aivk, BASIC, Python, 
l'anglais et le grec). En fait, pratiquement n'importe quel programmeur peut lire un 
bout de code Perl bien ecrit et se faire une idee de son fonctionnement. 

Le plus important est le fait que vous n'avez pas besoin de tout connaitre de Perl avant 
de pouvoir ecrire des programmes utiles. On peut apprendre Perl « par le petit bout de 
la lorgnette ». Vous pouvez programmer comme un enfant qui commence a parler, 
nous vous promettons de ne pas rire. De nombreuses idees de Perl sont empruntees au 
langage naturel, et l'une des meilleures est qu'il n'y a aucun probleme a utiliser un sous- 
ensemble du langage tant qu'on arrive a ses fins. N'importe quel niveau de competence 
technique est acceptable dans la culture Perl. II n'existe pas de police du langage. Un 
script Perl est « correct » s'il vous aide a terminer votre travail avant que le patron ne 
vous mette dehors. 

Bien qu'il soit simple par de nombreux aspects, Perl est egalement un langage riche 
dont il y a beaucoup a apprendre. C'est le prix a payer pour faciliter ce qui est difficile. 
II vous faudra un certain temps pour en assimiler toutes les possibilites, mais vous serez 
heureux d'avoir acces a ses remarquables capacites quand vous en aurez besoin. Nous 
avons fait remarquer plus haut que Perl emprunte de nombreuses aptitudes aux shells 
et au C, mais il possede aussi un sur-ensemble strict de celles de sed et de awk. II existe 
en fait des traducteurs fournis avec Perl pour transformer les anciens scripts sed et awk 
en scripts Perl, et vous pouvez done voir comment les fonctionnalites avec lesquelles 
vous pouvez deja etre familiers correspondent a celles de Perl. 

En raison de cet heritage, Perl etait deja riche alors meme qu'il n'etait qu'un langage de 
reduction de donnees, concu pour naviguer dans des fichiers, scruter de grandes quan- 
tites de texte, creer et obtenir de donnees dynamiques et afficher des rapports facile- 
ment formates se basant sur ces donnees. Mais a un moment donne, Perl a commence 
a s'epanouir. II est alors devenu un langage de manipulation de systemes de fichiers, de 
gestion de processus, d'administration de bases de donnees, de programmation client- 
serveur, de programmation securisee, de gestion d'informations basees sur le Web, et 
meme de programmation orientee objet et fonctionnelle. Ces possibilites n'ont pas ete 
simplement collees apres coup ; chacune fonctionne en synergie avec les autres, parce 
que Perl a ete concu des le depart comme un langage d'integration. 

Mais Perl peut integrer plus que ses propres capacites. Perl est concu pour etre extensi- 
ble de facon modulaire. Perl vous permet de rapidement concevoir, programmer, met- 
tre au point et deployer des applications, mais il vous permet egalement d'etendre 
aisement les fonctionnalites de ces applications quand le besoin s'en fait sentir. On peut 
integrer Perl a d'autres langages, et on peut integrer d'autres langages a Perl. Le meca- 
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nisme d'importation de modules permet d'utiliser ces definitions externes comme s'il 
s'agissait de fonctionnalites propres a Perl. Les bibliotheques orientees objet conservent 
cette propriete. 

Perl vous assiste en bien d'autres manieres. Perl compile d'abord votre programme dans 
un code intermediaire, alors qu'un langage interprete classique compile et execute une 
commande a la fois. II effectue diverses optimisations comme tout autre compilateur et 
donne des resultats instantanes concernant entre autres les erreurs de syntaxe et les pro- 
blemes de liaison avec les bibliotheques. Une fois que la partie en amont a valide le pro- 
gramme, elle passe le code intermediaire a l'interpreteur en aval qui l'execute (ou, si 
l'on prefere, a une autre routine de traitement capable d'emettre du code C ou du lan- 
gage machine). Tout ceci peut paraitre complique, mais le compilateur et l'interpreteur 
sont assez efficaces, et la plupart d'entre nous comptent le cycle compiler-lancer-debo- 
guer en secondes. Ce cycle rapide associe a une gestion « douce » des erreurs fait de Perl 
un langage ideal pour le prototypage. Au fur et a mesure que le programme se develop- 
pe, on peut resserrer les boulons et programmer avec moins de flair mais plus de disci- 
pline. Perl vous y aide egalement, quand vous le lui demandez gentiment. 

Perl vous permet aussi d'ecrire des programmes plus surs. En plus des interfaces de se- 
curite implementees par les autres langages, un mecanisme de tracage automatique des 
source d'insecurite, bloque toute operation dangereuse. Enfin, Perl permet de definir 
des compartiments specialement proteges dans lesquels on peut executer en toute secu- 
rite du code Perl d'origine douteuse, en masquant les operations dangereuses. 

Mais, paradoxalement, la meilleure aide que Perl puisse vous apporter n'a presque rien 
a voir avec Perl, mais tout a voir avec les gens qui l'utilisent. Les Perlistes comptent par- 
mi les gens les plus utiles sur terre, vraiment. S'il existe un aspect religieux au mouve- 
ment Perl, c'est celui-la. Larry a voulu que la communaute Perl fonctionne comme un 
bout de paradis, et il semble que son souhait se soit realise jusqu'a present. Puissiez-vous 
faire de votre mieux pour que cela continue. 

Que vous appreniez Perl parce que vous voulez sauver le monde, ou simplement parce 
que vous etes curieux, ou encore parce que votre patron vous a dit de vous y mettre, ce 
livre vous menera de ses bases les plus elementaires vers ses labyrinthes les plus obscurs. 
Et meme si nous n'avons pas l'intention de vous apprendre a programmer, le lecteur at- 
tentif en retirera un peu de l'art, et de la science, de la programmation. Nous vous en- 
couragerons a developper les trois grandes vertus du programmeur : la paresse, 
Yimpatience et Yorgueil. Tout au long de ce parcours, nous esperons que vous trouverez 
ce livre assez amusant par certains cotes (et d'un humour ravageur par d'autres). Et si 
rien de tout cela ne vous suffit, souvenez-vous que l'apprentissage de Perl enrichira vo- 
tre curriculum vitae. Continuez done votre lecture. 

Ce qui est nouveau dans cette edition 

Presque tout... 

Sauf des morceaux choisis de la precedente edition (et ils etaient nombreux), nous 
avons entierement revise la presente edition pour plusieurs raisons. Premierement 
nous avons voulu rendre le livre accessible a un plus large public. II y a tres peu de pre- 
requis. Nous avons volontairement choisi un style vivant pour garder eveilles ceux qui 
en auraient beaucoup (des prerequis). 
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Deuxiemement, nous avons presente les derniers developpements de Perl. Meme si 
ceux-ci restent a l'etat d'experience de laboratoire, le noyau central est solidement plan- 
te. La foulee a adopter pour suivre le developpement de certaines extensions, peut etre 
torride. C'est pourquoi nous vous indiquerons d'aller voir plutot la documentation en 
ligne, pour preciser certains aspects, car Perl est un langage de mecanicien et on peut 
confondre un boulon de 8 avec un boulon de 10. 

Enfin, nous avons adapte cette edition pour en faciliter la lecture, en separant les chapi- 
tres en parties introduisant chacune un concept, dans le but de mieux saisir Fensemble. 
Cette nouvelle edition s'organise ainsi : 

Partie I, Survol de Perl 

Le demarrage est toujours difficile. Cette partie presente les idees fondamentales du 
langage sur un ton informel et est a lire au coin du feu. II s'agit plus d'un marche- 
pied que d'un didacticiel complet, et elle peut ne pas correspondre aux besoins de 
tout le monde. Voir la section Documentation papier pour les livres qui pourraient 
mieux convenir. 

Partie II, Seance de dissection 

Cette partie est un developpement a batons rompus et en profondeur des mecanis- 
mes essentiels du langage a chaque niveau d'abstraction, depuis les types de don- 
nees, les variables, les expressions regulieres jusqu'aux routines, modules et objets. 
Vous y acquerrez une bonne mesure du fonctionnement de ce langage ainsi que 
quelques bonnes methodes de conception de logiciels. (Et si vous n'avez jamais uti- 
lise un langage permettant la reconnaissance des modeles, vous allez avoir un trai- 
tement de faveur.) 

Partie III, Technique Perl 

II est possible de faire beaucoup de choses avec Perl et ce chapitre vous emmenera 
beaucoup plus loin. Ici, vous apprendrez comment repondre a tous les defis lances 
par votre machine, depuis le traitement des caracteres Unicode, la communication 
entre processus, le multithreading, la compilation, le debogage et l'optimisation de 
Perl, jusqu'a l'ecriture de vos propres extensions en C ou C++ ou l'interfacage de 
toute API. Perl est tout a fait adapte pour communiquer avec votre PC, et si besoin 
avec les autres PC sur Internet. 

Partie IV, Culture Perl 

Toute culture ayant un langage, la communaute Perl a vite compris qu'elle devait se 
forger une culture. Nous verrons dans cette partie la programmation Perl dans la 
vie de tous les jours. Nous verrons comment reconnaitre les bons des mechants, et 
aussi comment nous ameliorer pour produire des programmes reutilisables par 
tout le monde. 

Partie V, References 

Nous avons regroupe dans cette partie tous les termes importants de chaque chapi- 
tre, depuis les variables et fonctions speciales, aux modules et pragmas standards. Le 
glossaire sera particulierement utile a ceux qui ne sont pas familiers avec le jargon 
informatique. Par exemple, si vous ignorez le sens du terme « pragma », vous pou- 
vez le decouvrir des maintenant. 
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Distribution standard 

Aujourd'hui, la grande majorite des systemes d'exploitation comprennent une distribu- 
tion de Perl en standard. Au moment oil ces lignes sont ecrites, les systemes AIX, BeOS, 
BSDI, Debian, DG/X, DYNIX/ptx, FreeBSD, IRIX, LynxOS, Mac OS X, OpenBSD, Red- 
Hat, SINIX, Slackware, Solaris, SuSE, Mandrake et Tru64, sont tous distribues avec une 
version de Perl en standard. Certaines societes fournissent Perl sur un CD de distribu- 
tion libre ou bien par l'intermediaire de leur service client. Des societes tierces comme 
ActiveState, proposent des distributions pour differents systemes y compris Microsoft. 

Meme si votre distributeur livre Perl en standard, vous aurez probablement envie de 
compiler et d'installer Perl vous-meme. Vous serez ainsi certain d'avoir la derniere ver- 
sion, et de pouvoir installer oil bon vous semble la documentation ainsi que les biblio- 
theques. Vous pourrez aussi choisir parmi les differentes options de compilation tels 
que le multithreading, la gestion des grands fichiers, ou bien les options de debogage de 
bas niveau disponible par le selecteur -D. (Le debogage niveau utilisateur est toujours 
supporte.) 

La facon la plus simple d'obtenir les sources de Perl est d'aller a www.perl.com, oil vous 
trouverez les informations les plus importantes, ainsi que des liens vers des distributions 
binaires specifiques aux plates-formes sans compilateurs C. 

Vous pouvez aussi vous rendre directement sur le CPAN (Comprehensive Perl Archive 
Network, decrit au chapitre 22, CPAN, a l'adresse http://www.Perl.com/CPAN ou bien 
http://www.cpan.org. Si ces adresses sont trop lentes (c'est possible car elles sont tres po- 
pulates), vous pouvez choisir ainsi un miroir plus proche de chez vous. Les adresses url 
suivantes ont ete choisies parmi les centaines de miroirs CPAN dans le monde : 

http://www.funet.fi/pub/languages/Perl/CPAN/ 
ftp://ftp.funet.fi/pub/languages/Perl/CPAN/ 
ftp://ftp. cs. Colorado. edu/pub/Perl/CPAN/ 
ftp://ftp.cise.ufl.edu/pub/Perl/CPAN/ 
ftp://ftp.Perl.org/pub/Perl/CPAN/ 

http://www.Perl.com/CPAN-local 

http://www. cpan. org/ 

http://www.Perl.org/CPAN/ 

http://www. cs. uu.nl/rn irror/CPAN/ 

http://CPAN.pacific.net.hk/ 

Les deux premieres de la liste, sur le site funet.fi, pointent sur le repertoire maitre de 
tous les sites CPAN. Le iichier MIRRORED.BY contient la liste de tous les sites pour lais- 
ser le choix du site miroir ainsi que du protocole pour le telechargement (FTP ou 
HTTP), ce qui est utile lorsque votre reseau est derriere un firewall. Le site multiplexeur 
http://www.Perl.com/CPAN vous aide a faire cette selection. 

Une fois que vous avez recupere et decompacte le code source dans un repertoire, vous 
devez lire les fichiers README et INSTALL pour comprendre comment construire Fexe- 
cutable Perl. II peut aussi y avoir un fichier INSTALL.platform oil platform designe votre 
plate-forme systeme. 
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Si votre platform est un systeme Unix ou similaire, alors les commandes pour charger, 
configurer, construire et installer Perl seront celles qui suivent. Premierement vous de- 
vez utiliser une commande pour charger le code source. Avec ftp : 

% ftp ftp : //f tp . f unet . f i/pub/languages/Perl/CPAN/src/latest . tar . gz 

(vous pouvez substituer un miroir CPAN plus proche. Si vous habitez en Finlande c'est 
votre miroir CPAN le plus proche.) Si vous ne pouvez utiliser ftp, alors telecharger sur 
le Web avec un navigateur ou bien la ligne de commande suivante : 

% wget http : //www. f unet . f i/pub/languages/Perl/CPAN/src/latest . tar . gz 

Ensuite, il faut decompacter, configurer, construire et installer : 

% tar zxf latest. tar. gz ou gunzip, et ensuite tar xf. 

% cd Perl-5.6.0 ou 5.* pour toute version. 

% sh Configure -des Reponses par defaut. 

% make test && make install En mode super-utilisateur. 

Ces commandes s'effectuent dans un environnement de developpement C convention- 
al, et necessitent done un compilateur C. Pour connaitre les differentes mises a jour et 
versions de Perl pour chaque plate-forme, si vous avez besoin d'une version standard ou 
d'un portage special, explorez le repertoire CPAN ports. Des liens sont disponibles pour 
telecharger ses portages speciaux ou pour les systemes ne disposant pas de compilateurs C. 

Documentation en ligne 

L'importante documentation en ligne de Perl fait partie de la distribution standard. 
(Voir la section suivante pour la documentation papier.) Chaque module CPAN est ac- 
compagne de sa documentation. 

Quand nous faisons reference au « manuel Perl », nous parlons de l'ensemble des pages 
en ligne du manuel Perl, sur votre PC. Le terme manuel est purement une convention 
indiquant un fichier contenant de la documentation (nul besoin d'un programme man 
pour la lire. Elles peuvent meme etre au format HTML sur les systemes differents 
d'Unix. 

Le manuel Perl en ligne a ete divise en differentes sections, pour pouvoir facilement 
trouver ce que Ton cherche sans avoir a parcourir des centaines de pages de texte. Le ma- 
nuel Perl de base se nomme perl, et on y accede avec la commande man perl 1 . Ce manuel 
vous orientera vers d'autres plus specifiques. Par exemple man perlre affichera le manuel 
des expressions regulieres de Perl. La commande perldoc fonctionne souvent sur les sys- 
temes ou la commande man ne fonctionne pas. Sur Mac, il faut utiliser le programme 
Shuck. Votre distribution peut aussi fournir le manuel Perl au format HTML, ou bien le 
format d'aide natif du systeme hote. 



1. Si vous obtenez une page illisible c'est probablement que votre version de manuel est trop 
ancienne. Verifiez votre variable d'environnement MANPATH. (Essayez la commande perldoc perl 
pour configurer MANPATH sur la valeur retournee par la commande perl -V:man.dir.) 
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Consultation du manuel standard 

A l'origine du langage, en 1987, le manuel perl etait un document concis d'environ 
vingt-quatre pages dactylographiees. La section concernant les expressions regulieres 
n'occupait que deux paragraphes. (avec la connaissance de la commande egrep cela pou- 
vait suffire.) D'une certaine facon tout a change depuis : de la documentation standard, 
les differents utilitaires, Finformation pour le portage entre les differentes plates-formes 
et les centaines de modules standard, il y a maintenant plus de 1500 pages dactylogra- 
phies de documentation reparties entre plusieurs manuels. (Sans compter les modules 
CPAN que vous installerez.) 

D'un autre cote rien n'a change : le manuel de base perl existe toujours, et c'est toujours 
le point de depart si vous etes perdu. La difference est que lorsque vous y etes, vous ne 
pouvez vous y arreter. La documentation Perl n'est plus une petite epicerie mais un 
grand centre commercial avec des centaines de magasins oil il est necessaire de savoir oil 
Ton est pour savoir oil Ton va. Une fois que Ton connait le plan, il est facile de s'orienter. 

Voici quelques points de repere que vous pourrez rencontrer le : 



Manuel 


Sujet 


perl 


Les differents manuels Perl disponibles. 


perldata 


Les types de donnees. 


perlsyn 


La syntaxe Perl. 


perlop 


Precedence des operateurs. 


perlre 


Les expressions regulieres. 


perlvar 


Les variables predefinies. 


perlsub 


Les routines Perl. 


perlfunc 


Les fonctions predefinies. 


perlmod 


Mise en ceuvre des modules. 


perlref 


Les references. 


perlobj 


Les objets. 


perlipc 


La communication interprocessus. 


perlrun 


L'utilisation des commandes Perl avec selecteurs. 


perldebug 


Le debogage. 


perldiag 


Les messages de diagnostic. 



C'est juste un apercu, mais ce sont les entrees essentielles : si vous voulez connaitre un 
operateur, perlop vous donnera la reponse, et vous cherchez une chose sur les variables 
predefinies, regardez dans perlvar. Pour comprendre un message d'erreur, allez dans 
perldiag. Et ainsi de suite. 

Les FAQ (questions revenant frequemment) sont une partie standard du manuel Perl. 
Elles sont divisees en neuf manuels differents : 
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Manuel 


Sujet 


perlfaql 


Les questions generates sur Perl. 


perlfaq2 


La recuperation et l'apprentissage de Perl. 


perlfaq3 


Les outils de programmation. 


perlfaq4 


Les manipulation des donnees. 


perlfaq5 


Les fichiers et formats. 


perlfaqS 


Les expressions regulieres. 


perlfaq7 


Les questions d'ordre general sur le langage. 


perlfaq8 


L'interaction avec le systeme. 


perlfaq9 


La connexion au reseau. 


Certains manuels rassemblent des notes specifiques a certaines pla 


Manuel 


Sujet 


perlamiga 


Le portage sur Amiga. 


perlcygwin 


Le portage sur Cygwin. 


perldos 


Le portage sur MS DOS. 


perlhpux 


Le portage HP UX. 


perlmachten 


Le portage sur Power MachTen. 


perlos2 


Le portage sur OS/2. 


perlos390 


Le portage sur OS/390. 


perlvms 


Le portage sur DEC VMS. 


perlwin32 


Le portage sur MS-Windows. 



(Voir aussi le chapitre 25, Portability, et le repertoire des portages du CPAN deja decrit 
pour toute information relative a ce sujet.) 



Recherche dans le manuel 

N'essayez pas de lire les 1500 pages du manuel, autant chercher une aiguille dans une 
botte de foin. II y a un vieux dicton qui dit qu'on ne peut pas grapper des arbres morts. 2 
Chacun des manuels Perl, dispose de son propre outil de recherche et de visualisation. 
II est possible de chercher une page du manuel en indiquant la commande constitute 
du nom du manuel suivi d'une expression reguliere comme parametre (voir le chapitre 
5, Recherche de motif) : 

% perlop comma 

% perlfunc split 

% perlvar ARCV 

% perldiag 'assigned to typeglob' 



2. N'oubliez pas le glossaire. 
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II est possible d'etendre la recherche sur un manuel entier, par exemple pour chercher 
dans les FAQ, utilisez la commande perlfaq (qui est aussi un manuel) : 

% Perlfaq round 

La commande perltoc (aussi un manuel) cherche dans le sommaire general de tous les 
manuels : 

% perltoc typeglob 

Perl5005delta: Undefined value assigned to typeglob 

Perldata: Typeglobs and Filehandles 

Perldiag: Undefined value assigned to typeglob 

Ou alors, pour trouver une chame dans toutes les ressources en ligne du manuel, in- 
cluant les en-tetes, les descriptions et exemples, utilisez la commande perlhelp : 

% perlhelp CORE:: GLOBAL 

Voir le manuel perldoc pour les details. 

Les autres manuels 

Quand nous parlons de documentation non-Perl, comme par exemple dans getitimer (2), 
nous faisons reference aux manuels getitimer dans la section 2 du manuel Unix Program- 
mer's Manual. 3 Les pages du manuel pour les appels systeme tel getitimer peuvent ne pas 
etre presentes sur les systemes non Unix, mais ce n'est pas grave car vous ne pouvez pas 
les utiliser dans ce cas. Si vous en avez vraiment besoin, vous les trouverez facilement 
publies sur le Web — une recherche rapide de "+crypt(3) +manual" avec AltaVista vous 
permettra d'en obtenir plusieurs versions. 

Meme si les principaux manuels Perl sont installed dans la section 1 du repertoire stan- 
dard de man, nous omettrons l'indice (1) quand nous y ferons reference dans ce livre. 
Vous les reconnaitrez neanmoins sans difficulte car ils sont tous de la forme 
« peilmumble ». 

Documentation papier 

Voici quelques titres de la litterature Perl que nous vous recommandons de : 

• Perl 5 Precis et concis, 2 e ed., de Johan Vromans (O'Reilly, 2000). Ce manuel au for- 
mat poche est une reference pratique et rapide. 

• Perl en action, par Tom Christiansen et Nathan Torkington (O'Reilly, 1998). Un livre 
pour accompagner celui-ci. 

• Elements of Programming with Perl, Andrew L. Johnson (Manning, 1999). Pour com- 
mencer a partir de 0 en utilisant Perl, pour les non programmeurs. 



3. La section 2 contient les appels directs des fonctions du systeme. (et sont appelees « appels 
systemes », a ne pas confondre avec les appels a la fonction system, ce qui n'a rien a voir. Cepen- 
dant, les systemes different quant a ('implementation de ces « appels systemes » entre ceux qui 
utilisent la fonction system et ceux qui font appel aux fonctions de la bibliotheque C, ce qui fait 
que Ton peut trouver getitimer(2) dans la section 3 (Sous Programmes) au lieu de la section 2 
(Appels Systemes). 
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' Introduction a Perl, 2 e ed., par Randal Schwartz et Tom Christiansen (O'Reilly, 1997). 
Pour les administrateurs et programmeurs du systeme Unix : l'utilisation de 30 % 
du langage dans 70 % des cas. La version sur le systeme Microsoft revue par Erik 
Olson s'appelle LeamingPerlfor Win32 Systems. 

' Perl: The Programmer's Companion, par Nigel Chapman (Wiley, 1997). Ce livre tres 
concis est destine aux ingenieurs et programmeurs en informatique et considere 
Perl independamment de la plate-forme, d'une maniere complete. 

• Maitrise des expressions re'gulieres, par Jeffrey Friedl (O'Reilly, 1997). Bien qu'il 
n'inclut pas les derniers ajouts sur les expressions regulieres, il reste une reference 
indispensable pour quiconque cherche a mieux comprendre comment celles-ci 
fonctionnent. 

• Object Oriented Perl, par Damian Conway (Manning, 1999). Pour les debutants 
aussi bien que les programmeurs objet avances, ce livre etonnant developpe des 
techniques simples et exotiques dans le but d'ecrire des systemes objets puissants en 
Perl. 

• Mastering Algorithms with Perl, par Jon Orwant, Jarkko Hietaniemi et John Macdo- 
nald (O'Reilly, 1999). Toutes les techniques utiles d'un cours sur les algorithmes, 
sans les preuves ardues. Ce livre couvre les algorithmes fondamentaux dans le 
domaine des graphes, du traitement de texte, des ensembles et plein de bonnes cho- 
ses encore. 

Writing Apache Modules with Perl and C, par Lincoln Stein et Doug MacEachern 
(O'Reilly, 1999). Ce guide de la programmation web enseigne comment etendre les 
capacites du serveur Apache en utilisant le module turbo mod_Perl pour l'execution 
rapide des scripts CGI ainsi que 1' API de ce serveur accessible a Perl. 

• The Perl Journal, edite par Jon Orwant. Ce magazine trimestriel cree par des pro- 
grammeurs pour des programmeurs, detaille des trues et astuces, parle des dernie- 
res nouvelles et de plein d'autres choses encore. 

II existe une plethore de livres et de publications sur le sujet et nous avons surement 
oublie des references (nous avons neglige sans pitie les mauvaises). 

En plus de ceux que nous venons de citer, nous vous recommandons les livres suivants. 
lis n'ont pas un rapport direct avec le langage mais sont tres pratiques comme reference, 
pour la consultation et l'inspiration. 

• The Art of Computer Programming, par Donald Knuth, vol. 1, Fundamental 
Algorithms ; vol. 2, Seminumerical Algorithms ; et vol. 3, Sorting and Searching (Addi- 
son-Wesley, 1998). 

• Introduction to Algorithms, par Cormen, Leiserson et Rivest (MIT Press and McGraw- 
Hill, 1990). 

• Algorithms in C: Fundamental Data Structures, Sorting, Searching, 3 e ed., par Robert 
Sedgewick (Addison-Wesley, 1997). 

The Elements of Programming Style, par Kernighan et Plauger (Prentice-Hall, 1988). 

• The Unix Programming Environment, par Kernighan et Pike (Prentice-Hall, 1984). 

• POSIX Programmer's Guide, par Donald Lewine (O'Reilly, 1991). 

• Advanced Programming in the UNIX Environment, par W. Richard Stevens (Addison- 
Wesley, 1992). 
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' TCP/IP Illustrated, vols. 1-3, par W. Richard Stevens, (Addison-Wesley, 1994-1996). 
• Le seigneur des anneaux de I. R. R. Tolkien 

Ressources supplementaires 

L'Internet est une merveilleuse invention et nous decouvrons tous les jours comment 
utiliser tout son potentiel. (Certains prefereront « decouvrir » l'lnternet a la maniere 
dont Tolkien decouvre la « Terre du Milieu. ») 

Perl sur le web 

Allez voir la page d'accueil de Perl a l'adresse http://www.Perl.com/. On y parle des nou- 
veautes dans le monde Perl, vous y trouvez du code source et differents reportages, des 
articles thematiques, de la documentation, les dates des conferences et bien d'autres 
choses encore. 

Allez aussi voir la page des Mongueurs a l'adresse http://www.Perl.org et vous pourrez 
constater que Perl est comme une herbe sauvage qui pousse partout dans le monde sauf 
au pole sud. Des groupes locaux de mongueurs se reunissent regulierement avec les- 
quels vous pouvez echanger vos points de vue entre hackers. 

Groupe de news Usenet 

Les groupes de news Perl sont une source d'informations remarquable, bien que parfois 
confus. comp.lang.Perl.announce est un groupe modere d'un faible trafic sur les annonces 
concernant Perl. II s'agit frequemment de nouvelles versions, de corrections de bogues, 
de nouvelles extensions et de nouveaux modules et de FAQ {Frequently Asked Questions, 
questions frequemment posees 4 ). 

Le groupe comp.lang.Perl.misc traite aussi bien des problemes techniques que de la phi- 
losophic de Perl, des jeux en Perl et de la poesie en Perl. Tout comme Perl lui-meme, 
comp.lang.Perl.misc se veut utile, et aucune question n'est trop stupide. 5 

Le groupe comp.Iang.Perl.tk discute de l'utilisation du fameux module Perl/Tk. Le grou- 
pe comp.Iang.Perl.moduIes concerne le developpement et l'utilisation des modules Perl 
qui sont le meilleur moyen pour reutiliser le code. II y a d'autres groupes du type 
comp.lang.Perl.un _groupe qui n'existent pas au moment oil nous ecrivons ces lignes, alors 
n'hesitez pas a naviguer. 

Si vous n'utilisez pas un lecteur de news classique pour acceder a Usenet, mais plutot un 
navigateur web, placez devant le nom du groupe l'en-tete "news:" pour acceder a Fun de 
ceux que vous cherchez. (Cela fonctionne seulement si vous avez un serveur de news) 
Vous pouvez aussi les chercher a l'aide de AltaVista ou Deja en precisant « *Perl* » com- 
me nom du groupe d'utilisateurs. 

Un dernier groupe d'utilisateurs qu'il vous sera utile de consulter, au moins si vous etes 



4. Ou Foire Aux Questions. 

5. II est evident que certaines questions sont trop stupides... surtout celles dont la reponse se 
trouve dans la FAQ. 
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programmeur CGI, est le groupe comp.infosystems.wivw.authoring.cgi. Meme si ce n'est 
pas a strictement parler un groupe d'utilisateurs Perl, la plupart des programmes 
d'exemples sont ecrits en Perl, a moins que vous n'utilisez le module Apache mod_Perl, 
auquel cas vous pouvez consulter comp.infosystems.wwiv.servers.unix. 

Rapports de bogues 

Au cas — improbable — oil vous trouviez un bogue propre a Perl et non a votre pro- 
gramme, essayez de le reduire a un cas de test minimal avant de le rapporter via le pro- 
gramme Perlbug qui est fourni avec Perl. Voir le lien http://bugs.Perl.org pour plus 
d'informations. 

De Vaide en francais 

Si vous voulez en savoir plus sur Perl dans un cadre sympathique, il existe des groupes 
d'utilisateurs francophones de Perl. Voici d'ailleurs un message du fondateur d'un de ces 
groupes : 

J'espere que ce livre apportera satisfaction aux lecteurs francophones qui desirent 
(mieux) programmer en Perl. Ce n'est pas toujours possible pour quelqu'un dont 
l'anglais n'est pas la langue maternelle de comprendre toutes les subtilites des points 
techniques, ainsi que les plaisanteries et les jeux de mots qui sont legion dans la do- 
cumentation anglaise. Je crois savoir, pour avoir ecoute (et parfois repondu) a leurs 
questions, que les traducteurs de cet ouvrage n'ont pas failli sur les explications des 
subtilites techniques et aussi ont-ils fait de leur mieux pour traduire les plaisanteries. 

Toujours est-il que parfois, meme en lisant ce livre de maniere assidue, on n'arrive 
pas a comprendre comment faire marcher un module de CPAN, s'il existe un modu- 
le CPAN qui fait ce que l'on souhaite faire, ou s'il existe de meilleurs moyens pour 
effectuer une operation. A ce moment-la, on a envie de discuter avec d'autres person- 
nes. Par la plus forte coincidence, il existe des groupes d'utilisateurs de Perl. J'ai fonde 
le premier groupe francais il y a environ trois ans, a Paris. 

Ce sont des mongers, qu'on pourrait traduire par marchands ; mais que je prefere ecri- 
re mongueurs (mongueuses au feminin), pour rester plus fidele a la prononciation an- 
glaise. Nous avons un site web, ainsi qu'une liste de diffusion qui, en octobre 2001, 
compte environ 150 abonne(e)s. Nous avons egalement fonde une association, dont 
le but est de promouvoir l'utilisation de Perl en France, en soutenant la creation de 
nouveaux groupes d'utilisateurs (a ce jour, Toulouse et Marseille nous ont rejoint) et 
en organisant des conferences ou des cours consacres a Perl. 

C'est pourquoi je vous invite a venir nous rencontrer, sur notre site web 
(http://www.mongueurs.net/), notre liste ou a nos reunions (rendez visite au groupe lo- 
cal pres de chez vous ou mieux, fondez-en un !), pour decouvrir le cote humain qui 
se cache derriere le langage qui nous a tant apporte et qui continue a nous fasciner. 

David Landgren 

President de l'association « Les Mongueurs de Perl » 

Octobre 2001 
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Conventions typographiques 

Nous avons consacre une section propre pour decrire certaines conventions telles les 
conventions de codage decrites dans Programmation stylee au chapitre 24, Techniques cou- 
ramment employees. Les conventions lexicales sont indiquees dans le glossaire (notre lexi- 
que). 

Dans cette edition nous avons utilise les conventions typographiques suivantes : 
Italique 

Elle est utilisee pour les URL, manuels, noms de fichier et programmes. Les termes 
nouveaux sont en italique la premiere fois qu'ils apparaissent dans le texte. La plu- 
part sont repris plus precisement dans le glossaire. 

Chasse constante 

Elle est utilisee dans les exemples et pour indiquer du code insere dans du texte 
normal. Les valeurs sont ecrites en chasse constante entre guillemets (« »), qui bien 
sur ne font pas partie de la valeur. 

Chasse constante en gras 

Elle est utilisee pour les options de commande, ce qui permet de distinguer entre 
Foption avertissement -w et Poperateur -w pour le test d'un fichier. Elle est aussi 
utilisee pour le texte que vous entrez litteralement. 

Chasse constante en italique 

Elle est utilisee pour des termes generiques auxquels vous devez substituer vos 
valeurs personnelles. 

Nous listens beaucoup d'exemples qui sont pour la plupart des bouts de code qui peu- 
vent s'integrer dans une application plus large. Certains exemples sont des programmes 
complets et que vous pouvez reconnaitre avec l'en-tete de debut de ligne #!. Les pro- 
grammes les plus importants commencent par : 

#!/usr/bin/Perl 

D'autres programmes doivent aussi etre entres en ligne de commande. Nous avons uti- 
lise le symbole % pour indiquer un prompteur shell : 

% Perl -e 'print "Hello, world. \n" f 
Hello , world. 

Ce style representatif d'une ligne de commande Unix oil les simples guillemets repre- 
sentent la forme la plus « quotee ». La quotation, ainsi que les caracteres generaux (wild- 
cards), varient d'un systeme a Fautre. Par exemple beaucoup d'interpreteurs de ligne de 
commande sous MS DOS et VMS necessitent la double quotation en lieu et place des 
simples guillemets lorsqu'il est necessaire de grouper les arguments avec des espaces ou 
des caracteres generaux de remplacement. 

Remerciements 

Nous voulons remercier ici publiquement nos relecteurs pour leur patience dans l'edi- 
tion de cet ouvrage : Todd Miller, Sharon Hopkins Rauenzahn, Rich Rauenzahn, Paul 
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Sarathy, Gloria Wall, Dan Sugalski et Abigail. 

Nous voulons remercier tout particulierement Tim O'Reilly (et ses associes) d'encoura- 
ger les auteurs a faire un effort special pour rendre leurs livres agreables a lire. 



I 

Survol de Perl 



1 

Vue d 'ensemble 



Demarrage 

Nous pensons que Perl est un langage facile a apprendre et a utiliser, et nous esperons 
vous en convaincre. L'un des aspects les plus agreables de Perl est que Ton n'a pas besoin 
d'en ecrire beaucoup avant d'exprimer vraiment sa pensee. Dans de nombreux langages 
de programmation, il faut declarer les types, les variables et les sous-programmes que 
Ton va utiliser avant d'ecrire la premiere instruction de code executable. C'est une bon- 
ne approche pour des problemes complexes demandant des structures de donnees 
complexes ; mais pour pour beaucoup de problemes simples, que Ton rencontre tous 
les jours, il vaut mieux un langage de programmation dans lequel il suffit d'ecrire : 

print "Salut tout le monde!\n"; 

et ou le programme ne fait que cela. 

Perl est de ce genre de langage. En fait, cet exemple est un programme complet, et si on 
le donne a l'interpreteur Perl, il affiche « Salut tout le monde ! » a l'ecran. 1 (Le ca- 
ractere \n produit un saut de ligne en sortie.) 

Et voila. II n'y a pas non plus grand-chose a ecrire apres ce que Ton veut dire, d'ailleurs. 
A l'inverse de nombreux langages, Perl estime que s'arreter sans prevenir a la fin du pro- 
gramme n'est qu'une facon normale d'en sortir. On pent bien sur appeler explicitement 
la fonction exit si on le souhaite, de meme que Yonpeut declarer certaines variables ou 
certains sous-programmes, ou meme se forcer a declarer toutes les variables et tous les 
sous-programmes. A vous de voir. En Perl, vous etes libre de faire Ce Qu'il Faut, quelle 
qu'en soit votre definition. 

II existe d'autres raisons a la facilite d'emploi de Perl, mais il serait inutile de toutes les 
enumerer ici... car c'est l'objet de ce livre. Le diable est dans les details, comme disent les 
Anglo-saxons, mais Perl essaie aussi de vous sortir de l'enfer ou vous pouvez vous retrou- 
ver plonge. C'est a tous les niveaux que Perl essaye de vous faire arriver a vos fins avec 



1. Ou un script, ou une application, ou un executable, ou un machin. Ce qu'on veut. 
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le minimum d'ennuis et le maximum de plaisir. C'est pourquoi tant de programmeurs 
Perl affichent un sourire beat. 

Ce chapitre constitue un survol de Perl, et nous n'essayons pas de le presenter a la partie 
rationnelle de votre cerveau. Nous n'essayons pas plus d'etre complets ou logiques. Ce 
sera l'objet du prochain chapitre. Les Vulcains, les androi'des ainsi que les humains de 
cette espece, peuvent aller directement au chapitre 29, Fonctions, pour avoir toute Fin- 
formation. 

Ce livre presente Perl a Vautre partie de votre cerveau, que vous l'appeliez associative, ar- 
tistique, passionnee, ou simplement spongieuse. Dans ce but, nous presenterons divers 
aspects de Perl qui vous en donneront une image aussi claire que celle d'un elephant 
pour un aveugle. Allons, nous allons essayer de faire mieux. II s'agit ici d'un chameau, 
apres tout. Esperons qu'au moins un de ces aspects du langage vous mettra en selle. 

Langages naturels et artificiels 

Les langages ont d'abord ete inventes par les humains, pour les humains. Ce fait a par- 
fois ete oublie dans les annales de l'informatique. 2 Perl ayant ete concu (pour ainsi dire) 
par un linguiste occasionnel, il a ete invente pour fonctionner aussi aisement que le lan- 
gage naturel. Cela recouvre plusieurs notions, puisque le langage naturel fonctionne si- 
multanement a plusieurs niveaux. Nous pourrions enumerer ici nombre de ces 
principes linguistiques, mais le plus important est que les choses simples doivent le Tes- 
ter et que les choses complexes ne doivent pas etre impossibles. Cela peut sembler evi- 
dent, mais de nombreux langages informatiques ne remplissent pas ces deux conditions. 

Les langages naturels permettent les deux parce que les gens essayent continuellement 
d'exprimer des choses simples et des choses complexes, ce qui fait que le langage evolue 
pour gerer les deux. Perl a ete concu avant tout pour evoluer, et c'est ce qui s'est produit. 
De nombreuses personnes ont contribue a revolution de Perl au cours des ans. Nous 
plaisantons souvent en disant que le chameau est un cheval concu par un comite, mais 
si Ton y pense, le chameau est parfaitement adapte a la vie dans le desert. II a evolue 
pour devenir relativement autosuffisant. (En revanche, revolution de l'odeur du cha- 
meau est discutable. Cela vaut pour Perl.) 

Quand quelqu'un prononce le mot « linguistique », on pense en general soit a des mots, 
soit a des phrases. Mais les mots et les phrases ne sont que deux manieres pratiques de 
« morceler » la parole. lis peuvent tous deux etre scindes en unites semantiques plus pe- 
tites, ou combines en unites plus grandes. Et la signification de chaque unite depend lar- 
gement du contexte syntaxique, semantique et pragmatique dans lequel se trouve 
Funite. Le langage naturel comporte des mots de diverses sortes, des noms, des verbes, 
etc. Si je dis « pile » tout seul, il y a de fortes chances pour que vous pensiez qu'il s'agisse 
d'un nom. Mais je peux l'employer autrement : comme un verbe, comme un adverbe, 
etc., selon le contexte. Si je pile devant une pile de piles a minuit pile, j'ai interet a dis- 
poser d'une pile. 3 



2. Plus precisement, ce fait a parfois du etre rappele. 

3. Vous trouvez sans doute que ces considerations linguistiques manquent de sex-appeal. Le but 
est simplement de vous montrer en quoi Perl est different d'un langage informatique classique. 



Langages naturels et artificiels 



5 



De meme, Perl evalue les mots de facon differente dans des contextes differents. Nous 
le verrons plus tard. Souvenez-vous que Perl essaie de comprendre ce que vous dites ; il 
est a l'ecoute. Perl essaie vraiment d'aller jusqu'au bout. Dites ce que vous pensez, et en 
general, Perl le saisira (a moins d'ecrire des choses absurdes, bien sur ; l'analyseur de 
Perl comprend le Perl bien mieux que le Francais ou le Swahili). 

Mais revenons aux noms. Un nom peut designer un objet precis, ou il peut nommer 
une classe d'objets generique. La plupart des langages de programmation font cette dis- 
tinction, sauf que nous appelons valeur une chose precise et variable une chose generi- 
que. Une valeur existe quelque part, peu importe ou, mais une variable est associee a 
une ou plusieurs valeurs durant son existence. Ce qui interprete la variable doit garder 
la trace de cette association. Cet interpreteur peut se trouver dans votre cerveau, ou dans 
votre ordinateur. 

Syntaxe d'une variable 

Une variable n'est qu'un endroit pratique pour conserver quelque chose, un endroit qui 
a un nom, ce qui fait que vous pouvez retrouver vos petits quand vous y revenez plus 
tard. Tout comme dans la vie reelle, il existe de nombreux endroits pour ranger des cho- 
ses, certains prives et certains publics. Certains lieux sont temporaires et d'autres sont 
permanents. Les informaticiens adorent parler de « portee » des variables, mais c'est a 
peu pres tout ce qu'ils entendent par la. Perl connait de nombreux moyens de traiter les 
problemes de portee, ce que vous serez ravis d'apprendre le moment venu. (Regardez 
l'emploi des adjectifs local, my et our dans le chapitre 29, si vous etes curieux, ou bien 
regardez Declarations avec portee dans le chapitre 4, Instructions et declarations.) 

Mais on classifie plus efficacement les variables par le type de donnees qu'elles peuvent 
representer. De meme qu'en francais, la premiere distinction se fait entre le singulier et 
le pluriel. Les chames et les nombres sont des bouts de donnees singulieres, alors que 
les listes de chaines ou de nombres sont plurielles (et quand nous arriverons a la pro- 
grammation orientee objet, vous verrez qu'un objet peut paraitre singulier de l'exte- 
rieur, mais pluriel de l'interieur, de meme qu'une classe d'eleves). Nous appelons 
scalaire une variable singuliere, et tableau une variable plurielle. Comme une chame 
peut etre stockee dans une variable scalaire, nous pourrons ecrire une version un peu 
plus longue (et mieux commentee) de notre premier exemple comme ceci : 

$phrase = "Salut tout le monde !\n"; # Donner une valeur a une variable, 
print $phrase; # Afficher la variable. 

Remarquez que nous n'avons pas eu a predefinir le genre de la variable $phrase. Le ca- 
ractere $ dit a Perl que phrase est une variable scalaire, c'est-a-dire qu'elle contient une 
valeur singuliere. Une variable tableau, en revanche, commencerait par le caractere @ 
(on peut remarquer que $ est un « S » stylise, pour scalaire, alors que @ est un « a » sty- 
lise pour « array » , tableau en anglais). 

Perl connait d'autres types de variables aux noms bizarres comme « hachage », 
« handle » et « typeglob ». Tout comme les scalaires et les tableaux, ces types de varia- 
bles sont egalement precedes par des caracteres etranges. Dans un souci d'exhaustivite, 
voici la liste de tous les caracteres etranges que vous pourrez rencontrer : 
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Type 


Car. 


Exemple 


Est un nom pour 


scalaire 


$ 


$cents 


Une valeur propre (nombre, chaine). 


tableau 


i 


(Slarge 


Une liste de valeurs, indexees par numero. 


hachage 


% 


%interet 


Un groupe de valeurs indexees par chaine. 


sous-programme 


& 


Scomment 


Un bout de code Perl appelable. 


typeglob 


* 


*truc 


Tout ce qui est appele true. 



Pour certains « puristes » des langages, ces caracteres etranges sont une raison d'abhor- 
rer Perl. Cette raison est superficielle. Ces caracteres procurent de nombreux avantages : 
les variables peuvent etre interpolees dans des chaines sans syntaxe supplementaire. Les 
scripts Perl sont faciles a lire (pour ceux qui ont pris la peine d'apprendre Perl !) parce 
que les noms se distinguent des verbes, et que de nouveaux verbes peuvent etre ajoutes 
au langage sans abimer d'autres scripts (nous vous avions dit que Perl etait concu pour 
evoluer). Et l'analogie avec les noms n'a rien de frivole ; il existe de nombreux prece- 
dents dans divers langages naturels qui requierent des marqueurs de noms grammati- 
caux. Enfin, e'est notre avis ! 



Singularity 

D'apres notre exemple, on voit que Ton peut assigner une nouvelle valeur a un scalaire 
avec Poperateur =, comme dans de nombreux autres langages informatiques. On peut 
affecter n'importe quelle forme de valeur scalaire a une variable SCALAIRE : entier, 
nombre a virgule f lottante, chaine, et meme des choses esoteriques comme des referen- 
ces a d'autres variables ou a des objets. II existe de nombreuses facons de generer ces va- 
leurs a assigner. 

Comme dans le shell UNIX 4 , il est possible d'employer differents mecanismes de pro- 
tection (quoting) pour fabriquer differents types de valeurs. Les doubles apostrophes 
font une interpolation de variable 5 et une interpretation de Vantislash (Comme en transfor- 
mant \t en tabulation, \n en saut de ligne, \001 en controle-A, etc., dans la tradition de 
nombreux programmes UNIX, alors que les apostrophes suppriment a la fois l'interpo- 
lation et Finterpretation. Et les apostrophes inverses executent un programme externe 
et renvoient la sortie du programme, ce qui fait que Ton peut capturer une ligne unique 
contenant toutes les lignes de la sortie. 

$reponse = 42; # un entier 

$pi = 3.14159265; # un nombre "reel" 

$avocats = 6.02e23; # notation scientifique 

$animal = "Chameau"; # chaine 

$signe = "Mon $animal et moi"; # chaine avec interpolation 



4. Nous parlons ici de tous les clones UNIX comme BSD, Linux et Unix. 

5. Parfois appelee « substitution » par les programmeurs shell, mais nous preferons reserver ce 
mot pour quelque chose d'autre en Perl. II vaut done mieux parler d'interpolation. Nous 
employons ce terme dans son sens textuel (« Ce passage est une interpolation gnostique ») et 
non dans son sens mathematique (« Ce point du graphe est une interpolation entre deux autres 
points »). 
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$cout = 'Cela coute $100'; # chaine sans interpolation 

$pourquoi = $parceque; # une autre variable 

$x = $taupes * $avocats; # une expression 

$exit = system("vi $x"); # code de retour d'une commande 

$cwd = ~pwd~; # chaine generee par une commande 

Et meme si nous n'avons pas encore vu les valeurs exotiques, nous devons signaler que 
les scalaires peuvent referencer d'autres types de donnees incluant les sous-programmes 



et les objets. 












$ary = \@montableau; 


# 


reference 


a 


un 


tableau nomme 


$hsh = \%monhachage; 


# 


reference 


a 


un 


hachage nomme 


$sub = \&monsousprog; 


# 


reference 


a 


un 


sous-programme 


$ary = [1,2,3,4,5]; 


# 


reference 


a 


un 


tableau anonyme 


$hsh = {Na=>19, Cl=>35}; 


# 


reference 


a 


un 


hachage anonyme 


$sub = sub { print $pays }; 


# 


reference 


a 


un 


sous -programme anonyme 


$fido = new Chameau "Amelia"; 


# 


reference 


a 


un 


objet 



Les variables non initialisers se mettent a exister quand le besoin s'en fait sentir. D'apres 
le principe de moindre surprise, elles sont creees avec une valeur nulle, que ce soit " " 
ou 0. Selon l'endroit oil elles sont utilisees, les variables sont automatiquement inter- 
preters comme des chaines, des nombres ou les valeurs « vrai » et « faux » (commune- 
ment appelees valeurs booleennes). Les operateurs attendent certains types de valeurs 
en parametres, et nous dirons done que ces operateurs « fournissent » ou « procurent » 
un contexte scalaire a ces parametres. Nous serons parfois plus specifiques et dirons qu'il 
fournit un contexte numerique, un contexte de chaine ou un contexte booleen a ces pa- 
rametres (nous parlerons plus loin du contexte de liste, qui est l'inverse du contexte sca- 
laire). Perl convertit automatiquement les donnees sous la forme requise par le contexte 
courant, non sans raison. Par exemple, supposons que nous ayons ecrit ceci : 

$chameaux = '123'; 

print $chameaux + 1, "\n"; 

La valeur originelle de $chameaux est une chaine, mais elle est convertie en un nombre 
pour y ajouter 1, puis reconvertie en chaine pour etre affichee : "124". Le saut de ligne, 
represente par "\n", est egalement dans un contexte de chaine, mais puisqu'il est deja 
une chaine, aucune conversion n'est necessaire. Mais remarquez que nous avons du em- 
ployer des apostrophes doubles ; les apostrophes simples (') autour de \n auraient don- 
ne une chaine a deux caracteres constitute d'un antislash suivi d'un n, ce qui n'est en 
rien un saut de ligne. 

D'une certaine maniere, les apostrophes simples et doubles representent done un autre 
moyen de specifier le contexte. ^interpretation du contenu d'une chaine protegee de- 
pend de la forme de protection utilisee. Nous verrons plus loin certains autres opera- 
teurs qui fonctionnent comme des protections de facon syntaxique, mais qui utilisent la 
chaine d'une maniere speciale comme pour la correspondance de motifs ou la substitu- 
tion, lis fonctionnent tous comme des apostrophes doubles. Le contexte d'apostrophe 
double est le contexte « interpolatif » de Perl et est fourni par de nombreux operateurs 
qui ne ressemblent pas a des guillemets. 



8 



Chapitre 1 — Vue d'ensemble 



De la meme maniere, une reference se comporte comme telle lorsque vous etes dans un 
contexte de « dereferencement », sinon elle agit comme une simple valeur scalaire. Par 
exemple nous ecririons : 

$fido = new Chameau "Amelia"; 

if (not $fido) { die "chameau mort"; } 

$fido->seller(); 

Ici nous creons une reference a l'objet Chameau et la placons dans la variable $f ido. A 
la ligne suivante nous testons $f ido dans un contexte booleen, et nous levons une ex- 
ception si sa valeur est fausse, ce qui dans ce cas voudrait dire que le constructeur new 
Chameau a echoue a la creation de l'objet Chameau. Mais a la derniere ligne, nous utili- 
sons $f ido comme reference pour trouver la methode seller () appliquee a l'objet re- 
ference par $f ido, qui se trouve etre un Chameau, et done Perl cherche la methode 
seller () pour l'objet Chameau. Nous reviendrons sur ce sujet. Souvenez-vous juste 
pour le moment que le contexte est important en Perl, car il sert a lever toute ambiguite 
sans faire aucune declaration, contrairement a beaucoup d'autres langages. 

Pluralites 

Certains types de variables contiennent plusieurs valeurs qui sont logiquement liees en- 
tre elles. Perl connait deux types de variables multivaleurs : les tableaux et les hashes, ta- 
bles de hachage (ou hachages). lis se comportent comme des scalaires par de nombreux 
aspects. lis se mettent a exister quand le besoin s'en fait sentir et ne contiennent alors 
rien. Quand on leur assigne une valeur, ils fournissent un contexte de liste du cote droit 
de l'assignation. 

On emploie un tableau quand on veut chercher quelque chose par son numero. On em- 
ploie une table de hachage quand on veut chercher quelque chose par son nom. Ces 
deux concepts sont complementaires. On voit souvent des gens utiliser un tableau pour 
traduire les numeros de mois en noms, et un hachage correspondant pour traduire les 
noms en numeros (les hachages ne se limitent evidemment pas aux seuls nombres. Par 
exemple, il est possible d'avoir un hachage qui traduise les noms de mois en nom de 
pierres porte-bonheur). 

Tableaux. Un tableau est une liste ordonnee de scalaires, indicee par la position du sca- 
laire dans la liste. Celle-ci peut contenir des nombres, ou des chaines, ou un melange des 
deux (elle peut aussi contenir des references a d'autres listes ou hachages). Pour assigner 
une liste de valeurs a un tableau, il suffit de regrouper les variables (par des 
parentheses) : 

(fflmaison = ("lit", "chaise", "table", "poele"); 

Inversement, si Ton utilise @maison dans un contexte de liste, comme ce que Ton trouve 
a droite d'une assignation, on obtient la meme liste qui a ete entree. On peut done as- 
signer quatre variables depuis le tableau comme ceci : 

($Procuste, $porteurs, $multiplication, $gratter) = (Smaison; 

C'est ce que Ton appelle des assignations de liste. Elles se produisent logiquement en pa- 
rallel, et il est possible de permuter deux variables en ecrivant : 

($alpha,$omega) = ($omega,$alpha); 

Tout comme en C, les tableaux demarrent a zero ; quand on parle des quatre premiers 
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elements d'un tableau, leur enumeration court de 0 a 3. 6 Les indices de tableaux sont 
entoures de crochets [comme ceci], et si Ton veut selectionner un seul element du ta- 
bleau, on s'y refere par $maison[n], oil n est l'indice (un de moins que le numero de 
l'element) que Ton desire ; voyez l'exemple ci-dessous. Puisque l'element considere est 
un scalaire, il est toujours precede d'un $. 

Si Ton veut valoriser un seul element de tableau a la fois, on ecrit l'assignation prece- 
dente comme suit : 

$maison[0] = "lit"; 

$maison[l] = "chaise"; 

$maison[2] = "table"; 

$maison[3] = "poele"; 

Comme les tableaux sont ordonnes, il existe plusieurs operations utiles s'y rapportant, 
comme les operations de pile, push et pop. Une pile n'est apres tout qu'une liste ordon- 
nee, avec un debut et une fin. Surtout une fin. Perl considere que la fin de la liste est le 
haut d'une pile (bien que la plupart des programmeurs Perl pensent qu'une liste est ho- 
rizontale, le haut de la pile etant a droite). 

Hachages. Un hachage (hash en anglais) est un ensemble non ordonne de scalaires in- 
dexe par une valeur chame associee a chaque scalaire. C'est pourquoi les hachages sont 
souvent appeles « tableaux associatifs ». La principale raison pour laquelle leur appel- 
lation a change est que « tableau associatif » est long a ecrire pour les paresseux, et nous 
en parlons tellement souvent que nous avons decide de prendre un nom plus bref. 7 En- 
suite, le terme « hachage » souligne le fait qu'il s'agit de tables non ordonnees. Elle sont 
en fait implementees grace a un systeme de recherche dans une table de hachage, ce qui 
leur donne leur rapidite, rapidite qui reste inchangee quel que soit le nombre de valeurs 
presentes. On ne peut pas faire de push ou de pop sur un hachage, parce que cela n'a 
aucun sens. Un hachage n'a ni debut, ni fin. Les hachages sont neammoins tres puis- 
sants et tres utiles. Tant que vous ne penserez pas en terme de hachages, vous ne pense- 
rez pas en Perl. 

Puisque les clefs d'un tableau associatif ne sont pas ordonnees, vous devez fournir la clef 
aussi bien que sa valeur lorsque celui-ci est rempli. Vous pouvez aussi bien lui affecter 
une liste comme pour un tableau ordinaire, mais chaque paire d'elements sera interpre- 
tee comme la paire clef/valeur. Les tableaux associatifs utilisent le symbole % pour 
s'identifier. (Pour memoire, si vous regardez attentivement le caractere %, vous pouvez 
voir la clef et sa valeur avec entre deux le /.) 

Supposons que nous voulions traduire les abreviations des noms de jours en leurs cor- 
respondants complets. Nous pourrions ecrire cette assignation de liste : 

%longjour = ("Dim", "Dimanche", "Lun", "Lundi", "Mar", "Mardi", 
"Mer", "Mercredi", "Deu", "Deudi", "Ven", 
"Vendredi", "Sam", "Samedi"); 



6. Si cela vous semble bizarre, pensez a l'indice comme a un offset, un deplacement, c'est-a-dire 
le nombre d'elements qui le precedent. II n'y en a evidemment aucun avant le premier element, 
qui a done un offset de zero. C'est ainsi que pensent les ordinateurs (c'est du moins ce que nous 
pensons). 

7. Si tant est que Ton puisse qualifier de « bref » quoi que ce soit ayant trait aux hachages... 
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%longjour 




Figure 1-1. Un tableau et un hachage 



Comme il est parfois difficile de lire un hachage ainsi defini, Perl fournit la sequence => 
(egal, superieur) comme alternative a la virgule. Cette syntaxe (associee a un formatage 
creatif) facilite la distinction entre clefs et valeurs. 



%longjour 


= ( 




"Dim" 


=> 


"Dimanche", 


"Lun" 


=> 


"Lundi", 


"Mar" 


=> 


"Mardi", 


"Mer" 


=> 


"Mercredi", 


"Deu" 


=> 


"Deudi", 


"Ven" 


=> 


"Vendredi", 


"Sam" 


=> 


"Samedi", 



); 



II est non seulement possible d'assigner une liste a un hachage, comme nous l'avons fait 
ci-dessus, mais si Ton emploie un hachage dans un contexte de liste, celui-ci convertira 
le hachage en une liste de paires clef/valeurs dans un ordre quelconque. La plupart du 
temps, on se contente d'extraire une liste des seules clefs, grace a la fonction (bien nom- 
inee) keys. Elle est egalement non ordonnee mais peut etre facilement triee au besoin 
grace a la fonction (bien nominee) sort. On peut alors utiliser les clefs ordonnees pour 
acceder aux valeurs dans un ordre determine. 

Les hachages n'etant qu'une forme evoluee de tableau, il suffit d'en selectionner un ele- 
ment individuel en entourant la clef par des accolades. C'est ainsi que pour trouver la 
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valeur associee a Mer dans le hachage ci-dessus, il faut ecrire $longjour{"Mer"}. Remar- 
quez encore une fois qu'il s'agit d'une valeur scalaire et qu'il faut done ecrire $ et non %. 

D'un point de vue linguistique, la relation codee dans un hachage est genitive ou pos- 
sessive, comme les mots « de », « du » ou « d' » en francais. La femme d'Adam est Eve, 
et nous pouvons ecrire : 

$femme{"Adam"} = "Eve"; 

Complexites 

La famille des tableaux et des hachages permet de representer des structures de donnees 
simples et elegantes, mais dans la realite le probleme ne se pliera pas toujours a cette 
simplicite. II est parfois necessaire de construire des structures de donnees non lineaires. 
Perl nous permet de realiser ce type de structure d'une maniere tres simple. II permet 
en effet de manipuler de simples scalaires qui se referent a des tableaux. Nous le faisons 
tous les jours dans le langage courant lorsque nous utilisons un mot par exemple aussi 
complexe que « gouvernement » pour representer une entite aussi complexe et inscru- 
table. (C'est un exemple parmi d'autres.) 

Pour developper notre exemple precedent, supposons que nous parlons des femmes de 
Jacob et Adam. Jacob a eu quatre femmes. Nous pourrions penser l'ecrire de cette 
facon : 

$femme{"Dacob"} = ("Lea", "Rachel", "Bilha", "Zilpa"); # MAUVAIS 

Mais cette representation n'est pas bonne car meme les parentheses ne sont pas assez 
puissantes pour transformer une liste en scalaire. (Les parentheses sont utilisees pour le 
groupage syntaxique et les virgules pour la separation syntaxique.) Il faut indiquer a 
Perl que cette liste doit etre un scalaire. Les crochets sont parfaitement adaptes a cette 
fin: 

$femme{"Dacob"} = ["Lea", "Rachel", "Bilha", "Zilpa"]; # ok 

Cette ligne cree un tableau anonyme et affecte sa reference a l'element associatif 
$femme{ "Jacob" }. Ainsi nous avons un tableau associatif nomme contenant un tableau 
anonyme. C'est comme ca que Perl traite les tableaux multidimensionnels et les struc- 
tures de donnees imbriquees. Comme avec les types tableaux, on peut aussi affecter des 
elements separes comme ceci : 

$femme{"Dacob"}[0] = "Lea"; 

$femme{"Dacob"}[l] = "Rachel"; 

$femme{"Dacob"}[2] = "Bilha"; 

$femme{"Dacob"}[3] = "Zilpa"; 

Comme vous pouvez le voir, cela ressemble beaucoup a un tableau multidimensionnel 
avec des coordonnees de chaine puis numerique. Visualisons maintenant une structure 
de donnees imbriquees sous forme d'arbre oil nous listons aussi tous les fils de chacune 
des femmes de Jacob. Dans ce cas nous voulons utiliser le tableau associatif dans un con- 
texte scalaire. Pour cela utilisons les accolades. (La valeur de la clef est un tableau entre 
crochets. Maintenant nous avons un tableau a l'interieur d'une association, elle-meme 
association.) 

$filsDesFemmesDe{"Dacob"} = { 

"Lea" => ["Ruben", "Simeon", "Levi", "Duda", "Issachar", "Zabulon"], 
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"Rachel" => ["Joseph", "Benjamin"], 
"Bilha" => ["Dan", "Nephtali"], 
"Zilpa" => ["Gad", "Aser"], 

}; 

Les lignes suivantes sont equivalentes : 



$fils_des 


femmes 


_de{"Dacob"} 


{"Lea"}[0] 


= "Ruben"; 


$fils des 


femmes 


de{"Dacob"} 


{"Lea"}[l] 


= "Simeon"; 


$fils_des~ 


femmes 


"de{"]acob"} 


{"Lea"}[2] 


= "Levi"; 


$fils_des 


femmes 


"de{"]acob"} 


{"Lea"}[3] 


= "Duda"; 


$fils_des 


femmes 


"de{"]acob"} 


{"Lea"}[4] 


= "Issachar"; 


$fils des 


femmes 


"de{"]acob"} 


{"Lea"}[5] 


= "Zabulon"; 


$fils des" 


femmes 


"de{"Jacob"} 


{"Rachel"}[0] 


= "Joseph"; 


$fils_des_ 


femmes 


"de{":acob"} 


{"Rachel"}[l] 


= "Benjamin"; 


$fils_des 


femmes 


"de{":acob"} 


{"Bilha"}[0] 


= "Dan"; 


$fils_des 


femmes 


"de{":acob"} 


{"Bilha"}[l] 


= "Nephtali"; 


$fils des 


femmes 


"de{"Jacob"} 


{"Zilpa"}[0] 


= "Gad"; 


$fils_de S ; 


femmes 


de{"Dacob"} 


{"Zilpa"}[l] 


= "Aser"; 



On peut constater sur cet exemple que nous avons rajoute une dimension supplemen- 
tal a notre tableau. Perl nous laisse le choix, mais la representation interne est identi- 
que. 

Le point important a noter ici est que Perl nous permet de representer une structure de 
donnees complexes comme un simple scalaire. Cette encapsulation nous permet de 
construire une structure orientee objet. Lorsque nous avions invoque le constructeur de 
Chameau comme ceci : 

$fido = new Chameau "Amelia"; 

nous avions cree un objet Chameau represente par le scalaire $f ido. Mais la structure in- 
time de l'objet Chameau est plus compliquee. En tant que concepteurs d'objets, nous ne 
sommes pas concerned par ceci, a moins d'etre nous-memes les implementeurs des me- 
thodes de cette classe. Mais, generalement, un objet comme celui-ci serait represente par 
un tableau associatif contenant les attributs de Chameau, tels son nom (« Amelia » dans 
ce cas, et non pas « f ido »), le nombre de bosses (ce que nous n'avons pas specifie, mais 
il vaut probablement 1, regardez la couverture du livre). 

Simplicite 

Si votre tete ne tourne pas apres avoir lu cette derniere section alors vous avez une gros- 
se tete. La plupart des humains sont rebutes par les structures compliquees du type gou- 
vernement ou du type arbre genealogique. Pour cette raison nous disposons dans notre 
langage parle d'artifices qui cachent cette complexite sous-jacente. La technique la plus 
probante est la cloture du champ semantique, lexicalisation, topicalization en anglais, 
qui permet de s'accorder sur les termes du langage utilise. La consequence immediate 
est une meilleure communication. La plupart d'entre nous utilisent cette technique 
couramment pour basculer d'un contexte semantique vers un autre lorsque nous chan- 
geons simplement de sujet de conversation. 

Perl dispose dans sa palette de ce type d'outil. L'un de ceux-ci est fourni par la simple 
declaration package. Supposons que notre sujet est le Chameau de Perl. On declenche le 
module Chameau par la declaration : 
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package Chameau; 

Tout symbole declare ensuite sera prefixe par le nom du module « Chameau: : ». Ainsi 
si on ecrit : 

package Chameau; 
$fido = &fetch(); 

on ecrit en realite $Chameau: :fido et la fonction appelee est &Chameau: : fetch, (nous 
parlerons des verbes plus tard). Si dans le cours du deroulement du code, l'interpreteur 
rencontre le code suivant : 

package Chien; 
$fido = &fetch(); 

il ne pourra confondre les noms reels car $fido est en fait $Chien: :fido, et non $Cha- 
meau : : f ido. En informatique cela signifie un espace de nommage. II n'a pas de limite car- 
dinale. Perl n'en connait qu'un a la fois. La simplification est le choix libre du 
programmeur. 

Une chose remarquable est que dans : 

$fido = new Chameau "Amelia"; 

nous invoquons le verbe &new dans le package Chameau, qui a pour nom plein &Cha- 
meau: :new. et par 

$fido->seller(); 

nous invoquons la routine &Chameau : : seller, car $f ido pointe sur un Chameau. C'est la 
programmation objet en perl. 

La declaration package Chameau, marque le debut d'un paquetage, ici le paquetage Cha- 
meau. Parfois il suffit d'utiliser les noms et les verbes d'un paquetage existant. On utilise 
alors la declaration use, qui charge le module dans l'interpreteur. Cela doit s'ecrire : 

use Chameau; 
Puis on peut utiliser nos methodes 

$fido = new Chameau "Amelia"; 
Perl est WYSIWYG. Sinon Perl ne connaitrait pas Chameau. 

La chose interessante ici est qu'il est juste necessaire de connaitre les capacites d'un Cha- 
meau. II suffit de trouver le module sur CPAN : 

use Le: :Cool: :Module; 

Alors on peut actionner les verbes de ce module dans le champ du sujet. 

La lexicalisation Perl, comme dans le langage naturel, donne un nom au champ lexical. 
Certains modules definissent des ensembles lexicaux et uniquement cela, pour l'inter- 
preteur lui-meme. Ces modules speciaux se nomment pragmas. On verra souvent l'uti- 
lisation du pragma strict de cette maniere : 

use strict; 

Le pragma strict permet d'ajouter une norme pour 1'evaluation des termes par Perl. 
Cette norme oblige a preciser certains aspects comme la portee des variables du code, ce 
qui est utile dans le developpement de grands projets. En effet, Perl est optimise pour 
l'ecriture de petits modules, mais avec cette directive de compilation il devient possible 
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de gerer des projets importants. On peut en effet l'ajouter a tout moment dans des mo- 
dules elementaires, ce qui permet de les faire interagir dans un meme champ lexical. (Et 
autoriser du meme coup une approche objet dans le developpement de l'application 
elle-meme.) 

Verbes 

Comme tous les langages informatiques imperatifs, de nombreux verbes de Perl corres- 
pondent a des commandes : elles disent a l'interpreteur de Perl de faire quelque chose. 
En revanche, comme dans un langage naturel, les significations des verbes de Perl ten- 
dent a s'eparpiller dans plusieurs directions selon le contexte. Une instruction commen- 
cant par un verbe est en general purement imperative et evaluee entierement pour ses 
effets secondaires. Nous appelons souvent ces verbes procedures, surtout quand ils sont 
definis par l'utilisateur. Un verbe frequemment rencontre (que vous avez d'ailleurs deja 
vu) est la commande print : 

print "La femme cFAdam est ", Stemme-fAclam' }, ".\n"; 

L'effet secondaire produit la sortie desiree. 

Mais il existe d'autres « modes » que le mode imperatif. Certains verbes permettent 
d'interroger l'interpreteur sur certaines valeurs comme dans les conditionnelles comme 
if. D'autres verbes traduisent leurs parametres d'entree en valeurs de retour, tout com- 
me une recette vous indique comment transformer des ingredients de base en un resul- 
tat (peut-etre) comestible. Nous appelons souvent ces verbes des fonctions, par deference 
envers des generations de mathematiciens qui ne savent pas ce que signifie le mot 
« fonctionnel » en langage naturel. 

Un exemple de fonction interne est l'exponentielle : 

$e = exp(l); # 2.718281828459, ou a peii pres 

Mais Perl ne fait pas de distinction entre les procedures et les fonctions. Les termes se- 
ront employes de facon interchangeable. Les verbes sont parfois appeles sous-program- 
mes (subroutines) quand ils sont definis par l'utilisateur, ou operateurs (s'ils sont 
predefinis). Mais appelez-les comme il vous plaira ; ils renvoient tous une valeur, qu'elle 
soit ou non significative, que vous pouvez ou non choisir d'ignorer. 

Au fur et a mesure que nous avancons, nous verrons d'autres exemples du comporte- 
ment de Perl qui le font ressembler a un langage naturel. Nous avons deja insidieuse- 
ment presente certaines notions de langage mathematique, comme Faddition et les 
indices, sans parler de la fonction exponentielle. Perl est aussi un langage de controle, 
un langage d'integration, un langage de traitement de listes et un langage oriente objet. 
Entre autres. 

Mais Perl est aussi un bon vieux langage informatique. Et c'est ce a quoi nous allons 
maintenant nous interesser. 

Un exemple de notation 

Supposons que vous ayez un ensemble de notes pour chaque membre d'une classe 
d'eleves. Vous aimeriez une liste combinee de toutes les notes pour chaque etudiant, 
plus leur moyenne. Vous disposez d'un fichier texte (appele, quelle imagination, 
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« notes » ) qui ressemble a ceci : 

Xavier 25 
Samantha 76 
Herve 49 
Peter 66 
Olivier 92 
Thierry 42 
Fred 25 
Samantha 12 
Herve 0 
Corinne 66 
etc. 

Le script ci-dessous rassemble toutes leurs notes, determine la moyenne de chaque etu- 
diant et les affiche dans l'ordre alphabetique. Ce programme suppose, plutot naive- 
ment, qu'il n'existe pas deux Corinne dans votre classe. C'est-a-dire que s'il y a un 
deuxieme element pour Corinne, le programme supposera qu'il s'agit d'une autre note 
de la premiere Corinne. 

Au fait, les numeros de lignes ne font pas partie du programme, toute ressemblance 
avec le BASIC mise a part. 

1: #!/usr/bin/perl 
2: 

3: open(NOTESj "notes") or die "Ouverture des notes impossible : $!\n"; 

4: while ($ligne = <N0TES>) { 

5: ($etudiant, $note) = split(/ /, $ligne); 

6: $notes\{$etudiant\} .= $note . " "; 

7= } 

8: 

9: foreach $etudiant (sort keys %notes) { 
10: $scores = 0; 
11: $total = 0; 

12: @notes = split(/ /, $notes{$etudiant}); 
13: foreach $note ((Snotes) { 
14: $total += $note; 

15: $scores++; 
16: } 

17: $moyenne = $total / $scores; 

18: print "$etudiant: $notes{$etudiant}\tMoyenne : $moyenne\n"; 
19: } 

Ne louchez pas ainsi. Nous devons avouer que si cet exemple illustre beaucoup de ce que 
nous avons decrit jusqu'a present, il comprend certaines choses que nous allons main- 
tenant expliquer. Mais si vous regardez un peu dans le vague, vous pouvez commencer 
a voir apparaitre certains motifs interessants. Vous pouvez vous livrer a toutes les sup- 
positions imaginables, et nous vous dirons plus tard si vous aviez raison. 

Nous pourrions vous dire d'essayer de le lancer, mais peut-etre ne savez-vous pas com- 
ment faire. 
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Comment f aire 

Bien. Vous devez etre en train de vous demander comment lancer un programme Perl. 
La reponse la plus courte est que vous le donnez au programme interpreteur de Perl, 
qui s'appelle justement perl (notez le p minuscule). Une reponse plus complete com- 
mence comme ceci : II Existe Plus D'Une Facon De Faire. 8 

La premiere maniere d'invoquer perl (qui fonctionne sur la plupart des systemes d'ex- 
ploitation) est d'appeler explicitement perl depuis la ligne de commande. 9 Si vous vous 
trouvez sur une version d'UNIX et que ce que vous faites est relativement simple, vous 
pouvez utiliser l'option -e (le % de l'exemple suivant representant une invite standard 
de shell, il ne faut pas le taper) : 

% perl -e 'print "Salut tout le mondeIVy 

Sous d'autres systemes d'exploitation, il faudra peut-etre jouer des apostrophes. Mais le 
principe de base est le meme : vous essayez de rentrer tout ce que Perl doit savoir en 80 
colonnes. 10 

Pour les scripts plus longs, vous pouvez utiliser votre editeur favori (ou un autre) pour 
ecrire vos commandes dans un fichier, puis, si le script s'appelle « gradation », vous 
entrez : 

% perl gradation 

Vous invoquez toujours explicitement Finterpreteur Perl, mais au moins, vous n'avez 
pas a tout mettre sur la ligne de commande a chaque fois. Et vous n'avez pas a jouer des 
apostrophes pour plaire au shell. 

La facon la plus commode d'invoquer un script est de simplement l'appeler par son 
nom (ou de cliquer sur son icone), et de laisser le systeme d'exploitation trouver Finter- 
preteur tout seul. Sous certains systemes, il peut exister un moyen d'associer certaines 
extensions de fichier ou certains repertoires a une application particuliere. Sur les sys- 
temes UNIX qui supportent la notation # ! (appelee shebang), la premiere ligne du script 
peut etre magique et dire au systeme d'exploitation quel programme lancer. Mettez une 
ligne ressemblant 11 a la ligne 1 de notre exemple dans votre programme : 

#!/usr/bin/perl 

Tout ce qu'il vous reste a ecrire est maintenant : 

% gradation 

Ce qui ne fonctionne evidemment pas parce que vous avez oublie de rendre le script exe- 



8. There's More Than One Way To Do It : c'est le slogan de Perl, et vous allez etre fatigue de 
l'entendre, a moins que vous ne soyez FExpert Local, auquel cas vous serez fatigue de le repeter. II 
est quelquefois raccourci en TMTOWTDI, que l'on prononce « tim-toady ». Mais vous pouvez le 
prononcer de la facon qui vous plait. Apres tout, TMTOWTDI. 

9. En supposant que vous disposez d'une ligne de commande. Si vous travaillez avec un vieux 
Mac, vous aurez besoin de faire une mise a jour vers le systeme OS X. 

10. Ce genre de script est souvent appele one-liner, « une-ligne ». S'il vous arrive de frequenter 
d'autres programmeurs Perl, vous decouvrirez que certains d'entre eux sont friands de une-lignes. 
Perl a parfois ete qualifie de « langage en ecriture seule » a cause de ces voyous. 

11. Si Perl ne se trouve pas dum, /usr/bin, vous devrez changer la ligne # ! . 
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cutable (voir la page de manuel de chmod(l) et qu'il n'est pas dans votre PATH. Dans 
ce cas, vous devrez fournir un nom de chemin complet pour que votre systeme d'exploi- 
tation sache comment trouver votre script. Quelque chose comme : 

% ../bin/gradation 

Enfin, si vous avez la malchance de travailler sur un ancien systeme UNIX qui ne recon- 
nait pas la ligne magique # ! , ou si le chemin vers votre interpreteur est plus long que 
32 caracteres (une limite interne sur certains systemes), vous pourrez contourner le pro- 
bleme comme ceci : 

#!/bin/sh -- # perl, pour arreter de boucler 
eval 'exec /usr/bin/perl -S $0 
if 0; 

Certains systemes d'exploitation peuvent demander une modification de ce qui precede 
pour giver, /bin/sh, DCL, COMMAND.COM, ou tout ce qui vous tient lieu d'interpreteur 
de commandes. Demandez a votre Expert Local. 

Tout au long de ce livre, nous nous contenterons d'employer #! /usr/bin/perl pour re- 
presenter toutes ces notions et toutes ces notations, mais vous saurez a quoi vous en te- 
nir. 

Une astuce : quand vous ecrivez un script de test, ne l'appelez pas test. Les systemes 
UNIX ont une commande test interne, qui sera executee a la place de votre script. Ap- 
pelez-le plutot essai. 

Une autre astuce : pendant que vous apprenez Perl, et meme quand vous croyez savoir 
ce que vous faites, nous vous suggerons d'utiliser l'option -w, surtout pendant le deve- 
loppement. Cette option active toutes sortes de messages d'avertissement utiles et inte- 
ressants (dans le desordre). L'option -w peut etre placee sur la ligne « magique », comme 
ceci : 

#!/usr/bin/perl -w 

Maintenant que vous savez lancer votre programme Perl (a ne pas confondre avec le 
programme perl), revenons a notre exemple. 

Handles de fichiers 

A moins qu'il ne s'agisse d'un projet d'lA modelisant un philosophe solipsiste, votre 
programme a besoin de communiquer avec le monde exterieur. Aux lignes 3 et 4 de no- 
tre exemple de notation, on voit le mot NOTES, qui illustre un autre type de donnees de 
Perl, le handle de fichier. Un handle de fichier est un nom que Ton donne a un fichier, 
un peripherique, une socket ou un pipe pour que vous puissiez vous souvenir de ce dont 



12. Bien que Perl ait son lot de notations bizarres, celle-ci doit tout a UNIX. chmod(l) signifie que 
vous devez vous reporter a la page de manuel de la commande chmod a la section 1 de votre 
manuel UNIX. Si vous entrez soit man 1 chmod, soit man -s 1 chmod (selon votre type d'UNIX), 
vous devriez trouver tout ce que sait votre systeme de la commande chmod. (Bien sur, si votre 
type d'UNIX est « Pas UNIX ! » , vous devrez vous referer a la documentation de votre systeme 
pour la commande equivalente, a supposer que vous en soyez pourvu. Votre consolation etant 
que, si cette commande existe, elle aura un meilleur nom que chmod.) 
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vous parlez, et pour dissimuler certaines complexites, notamment relatives au tampons. 
(En interne, les handles de fichiers sont similaires aux streams d'un langage comme C 
ou C++, ou aux canaux d'E/S du BASIC.) 

Les handles de fichiers facilitent la gestion des entrees et des sorties depuis plusieurs 
sources et vers plusieurs destinations. C'est sa capacite a communiquer avec de nom- 
breux fichiers et de nombreux processus qui fait de Perl un bon langage d'integration. 13 

On cree un handle de fichier et on l'attache a un fichier par la fonction open, open prend 
deux parametres : le handle de fichier et le nom du fichier auquel on veut l'associer. Perl 
vous donne aussi quelques handles de fichier predefinis (et deja ouverts). STDIN est le 
canal d'entree standard du programme, alors que STDOUT en est le canal de sortie stan- 
dard. Et STDERR est un canal de sortie supplementaire pour que votre programme puisse 
faire des remarques a part pendant qu'il transforme (ou essaye de transformer) votre en- 
tree en sortie. 14 

Comme Ton peut utiliser la fonction open pour creer des handles de fichiers a des fins 
diverses (entrees, sorties, pipes), vous devrez pouvoir specifier le comportement que 
vous desirez. II suffit d'ajouter des caracteres au nom du fichier. 

open(SESAME, "nomdefichier"); # lire depuis un fichier existant 

open(SESAME, "<nomdef ichier "); # (idem, explicitement) 

open(SESAME, ">nomdef ichier "); # creer un fichier et y ecrire 

open(SESAMEj ">>nomdef ichier "); # ajouter a un fichier existant 

open(SESAME, "| sortie_de_commande"); # mettre en place un filtre de sortie 

open(SESAMEj "entree de commande |"); # mettre en place un filtre d'entree 

On voit que le nom en question est quelconque. Une fois ouvert, le handle de fichier 
SESAME peut etre utilise pour acceder au fichier, ou au pipe, jusqu'a ce qu'il soit expli- 
citement ferme (avec, on s'en doutait, close(SESAME)), ou si le handle de fichier est at- 
tache a un autre fichier par un autre open sur le meme handle. 15 

Une fois le handle de fichier ouvert en entree (ou si vous desirez utiliser STDIN), vous 
pouvez lire une ligne grace a l'operateur de lecture de ligne, <>. II est egalement connu 



13. Sans oublier les qualites suivantes : il travaille sur 8 bits sans probleme, il est integrable, et on 
peut y integrer d'autres choses via ses modules d'extension. II est concis et travaille sans probleme 
en reseau. II est pour ainsi dire conscient de son environnement. II est possible de l'invoquer de 
bien des manieres (comme nous l'avons deja vu). Mais surtout, le langage lui-meme est assez sou- 
pie pour qu'il soit possible de le faire « circuler » autour d'un probleme. On revient encore a ce 
fameux concept de TMTOWTDI. 

14. Ces handles de fichier sont typiquement attaches a votre terminal et vous pouvez done entrer 
des donnees vers votre programme et en voir le resultat, mais ils peuvent aussi se rattacher a des 
fichiers (ou equivalents). Perl fournit ces handles predefinis parce que le systeme d'exploitation 
les fournit deja, d'une facon ou d'une autre. Sous UNIX, les processus heritent de l'entree, de la 
sortie et de l'erreur standard de leur processus pere, typiquement un shell. L'une des taches d'un 
shell est de mettre en place ces flux d'E/S afin que le processus fils n'ait pas a s'en preoccuper. 

15. L'ouverture d'un handle de fichier deja ouvert ferme implicitement le premier fichier, le ren- 
dant ainsi inaccessible a ce handle, et ouvre un fichier different. II faut faire attention a ce que 
Ton veut vraiment faire. Cela se produit parfois accidentellement, comme quand Ton ecrit 
open($handle, $fichier), et que $handle contient une chaine constante. Assurez-vous d'assi- 
gner $handle, ou vous ne ferez qu'ouvrir un nouveau fichier sur le handle nul. 
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sous le nom d'operateur diamant en raison de sa forme. L'operateur diamant entoure le 
handle de fichier < SESAME > dont on veut lire des lignes. 16 Un exemple utilisant le handle 
de fichier STDIN pour lire une reponse fournie par l'utilisateur ressemblerait a ceci : 

print STDOUT "Entrez un nombre : "; # demander un nombre 

$nombre = <STDIN>; # entrer le nombre 

print STDOUT "Le nombre est $nombre\n"; # afficher le nombre 

Avez-vous vu ce que nous venons de vous glisser sous les pieds ? Qu'est-ce que ce STDOUT 
fait dans ces instructions print ? C'est simplement une des facons possibles d'utiliser un 
handle de fichier. Un handle de fichier peut etre fourni comme premier argument de 
Finstruction print et, s'il est present, il indique oil est la sortie. Dans ce cas, le handle 
de fichier est redondant, car la sortie aurait, de toute maniere, ete STDOUT. De mime que 
STDIN est l'entree par defaut, STDOUT est la sortie par defaut (nous l'avons enleve en ligne 
18 de l'exemple de notation pour eviter de vous embrouiller). 

Nous avons fait autre chose. Si vous essayez l'exemple ci-dessus, vous pouvez voir appa- 
raitre une ligne vide supplementaire. En effet, la lecture n'enleve pas automatiquement 
le saut de ligne de votre ligne d'entree (qui serait par exemple « 9\n » ). Au cas oil vous 
voudriez enlever le saut de ligne, Perl fournit les fonctions chop et chomp, chop enleve 
(et renvoie) le dernier caractere qu'on lui passe sans se poser de question, alors que 
chomp n'enleve que le marqueur de fin d'enregistrement (en general, "\n") et renvoie le 
nombre de caracteres enleves. Cette expression est souvent employee pour lire une seule 
ligne : 

chop($nombre = <STDIN>); # 

ce qui est identique a 

$number = <STDIN>; # 
chop($number); # 

Operateurs 

Comme nous l'avons laisse entendre plus haut, Perl est egalement un langage mathe- 
matique. C'est vrai a differents niveaux, depuis les operations logiques au niveau binaire 
jusqu'aux manipulations de nombres et d'ensembles, de predicats plus vastes a diverses 
abstractions. Et comme nous le savons tous depuis que nous avons etudie les mathema- 
tiques a l'ecole, les mathematiciens adorent les symboles etranges. Pire encore, les infor- 
maticiens ont invente leur propre version de ces symboles. Perl en connait un certain 
nombre, mais vous pouvez respirer car la plupart sont directement empruntes au C, au 
FORTRAN, a sed ou a awk, et seront done familiers aux utilisateurs de ces langages. 

Vous pouvez vous feliciter de connaitre plus de termes lexicaux, autant de point d'en- 
tree vers les autres langages. 

Les operateurs internes de Perl peuvent etre classes par nombre d'operandes, en opera- 
teurs unaires, binaires et ternaires. lis peuvent etre classes par operateurs infixes ou pre- 



lire le nombre et enlever le saut de ligne 

lire le nombre 

enlever le saut de ligne 



16. L'operateur diamant par defaut, <>, lit des lignes depuis tous les fichiers specifies sur la ligne 
de commande, ou depuis STDIN si aucun n'a ete specifie (ce comportement est standard pour de 
nombreux programmes « filtres » UNIX). 
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fixes, mais aussi par le type d'objet avec lesquels ils travaillent, comme les nombres, les 
chaines ou les fichiers. Nous vous donnerons plus loin une table de tous les operateurs, 
mais en voici quelques-uns par lesquels vous pourrez commencer. 

Quelques operateurs d'arithmetique binaire 

Les operateurs arithmetiques font exactement ce que Ton peut attendre d'eux apres les 
avoir etudies a l'ecole. 



Exemple 


Nom 


Resultat 


$a + $b 


Addition 


Somme de $a et de $b. 


$a * $b 


Multiplication 


Produit de $a et de $b. 


$a % $b 


Modulo 


Reste de $a divise par $b. 


$a ** $b 


Puissance 


$a puissance $b. 



Oui, nous avons bien laisse de cote la soustraction et la division. Mais vous devez pou- 
voir deviner comment celles-ci fonctionnent. Essayez-les et voyez si vous aviez raison (ou 
trichez et cherchez dans le chapitre 3, Operateurs unaires et binaires.) Les operateurs 
arithmetiques sont evalues dans l'ordre habituel (c'est-a-dire la puissance avant la mul- 
tiplication, et la multiplication avant l'addition). Les parentheses servent a modifier 
l'ordre. 

Operateurs sur les chaines 

II existe egalement un operateur d'« addition » pour les chaines, qui effectue leur con- 
catenation. Contrairement a d'autres langages qui le confondent avec l'addition arith- 
metique, Perl definit un operateur distinct ( . ) pour cette operation. 

$a = 123; 
$b = 456; 

print $a + $b; # affiche 579 
print $a . $b; # affiche 123456 

II existe aussi un operateur de « multiplication » pour les chaines, egalement appelee 
repetition. II s'agit encore d'un operateur distinct (x) qui le differencie de la multiplica- 
tion numerique : 

$a = 123; 
$b = 3; 

print $a * $b; # affiche 369 
print $a x $b; # affiche 123123123 

L'operateur de repetition est un peu inhabituel en ce qu'il prend une chaine pour son 
argument de gauche et un nombre pour celui de droite. Remarquez egalement com- 
ment Perl convertit automatiquement les nombres en chaines. Tous les nombres ci-des- 
sus pourraient etre proteges par des apostrophes doubles avec le meme resultat. La 
conversion interne se serait par contre produite dans le sens inverse (c'est-a-dire de chai- 
nes vers des nombres). 
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II faut encore penser a quelques details. La concatenation de chaines est egalement im- 
plicite dans l'interpolation qui se produit dans des chaines entre doubles apostrophes. 
Quant une liste de valeurs est affichee, les chaines de caracteres sont en fait concatenees. 
Les trois instructions suivantes produisent done le meme resultat : 

print $a . ' est egal a ' . $b . "\n"; # operateur point 

print $a, ' est egal a ', $b, "\n"; # liste 

print "$a est egal a $b\n"; # interpolation 

Le choix de celui qu'il convient d'utiliser ne depend que de vous. 

L'operateur x peut sembler relativement inutile a premiere vue, mais il trouve son uti- 
lite dans des cas comme celui-ci : 

print "-" x $lrgecr, "\n"; 

Ceci trace une ligne a travers l'ecran, a supposer que sa largeur soit $lrgecr. 

Operateurs d 'affectation 

Bien qu'il ne s'agisse pas vraiment d'un operateur mathematique, nous avons deja em- 
ploye en de nombreuses occasions l'operateur d'assignation simple, =. Essayez de vous 
souvenir que = signifie « est mis a » au lieu de « egale » (il existe aussi un operateur 
d'egalite mathematique == qui signifie « egale » , et si vous commencez a ref lechir tout 
de suite a la difference entre les deux, vous aurez beaucoup moins mal a la tete plus tard. 
L'operateur == est comme une fonction qui renvoie une valeur booleenne, alors que = 
est comme une procedure evaluee dont l'effet est de modifier une variable). 

De meme que les operateurs precedents, les operateurs d'assignation sont des opera- 
teurs binaires infixes, ce qui veut dire qu'ils ont un operande de chaque cote de l'opera- 
teur. L'operande de droite peut etre n'importe quelle expression, mais celui de gauche 
doit etre une lvalue correcte (ce qui, traduit en bon francais, signifie un emplacement 
de stockage valide, comme une variable ou un element de tableau). L'operateur d'assi- 
gnation le plus courant est l'assignation simple. II determine la valeur de l'expression a 
sa droite, puis met la variable a sa gauche a cette valeur : 

$a = $b; 
$a = $b + 5; 
$a = $a * 3; 

Remarquez que la derniere assignation se refere deux fois a la meme variable ; une fois 
pour le calcul et une autre pour l'assignation. Rien d'extraordinaire a cela, mais cette 
operation est assez commune pour qu'elle connaisse une abreviation (empruntee au C). 
Si Ton ecrit : 

lvalue operateur= expression 

cela sera evalue comme si e'etait : 

lvalue = lvalue operateur expression 

sauf que la lvalue n'est pas calculee deux fois. On ne percoit de difference que si revalua- 
tion de la lvalue a un effet secondaire. Mais quand il y a une difference, l'operateur fait 
generalement ce que vous vouliez. 

On peut, par exemple, ecrire : 

$a *= 3; 
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ce qui se lit « multiplier $a par 3 et l'affecter a $a ». Presque tous les operateurs binaires 
de Perl le permettent, et meme certains de ceux qui ne le peuvent pas en C : 

$ligne .= "\n"; # Ajouter un saut de ligne a $ligne. 

$fill x= 80; # Repeter $fill 80 fois sur elle-meme. 

$val | |= "2"; # Mettre $val a 2 si ce n'est pas deja le cas. 

La ligne 6 de notre exemple 17 de notation contient deux concatenations de chaihes, 
dont l'une est un operateur d'affectation. Et la ligne 14 contient un +=. 

Quel que soit le type d'operateur d'affectation utilise, la valeur finale qui est renvoyee 
est celle de l'affectation complete 18 . Ceci ne surprendra pas les programmeurs C qui le 
savait deja en ecrivant 

$a = $b = $c = 0; 

pour initialiser a 0 toutes les variables. 

Ce qui par contre les surprendra est que l'affectation Perl retourne en lvalue la variable 
elle-meme, de telle sorte qu'il est possible en une instruction de le modifier deux fois, 
c'est pourquoi nous pouvons ecrire : 

($temp -= 32) *= 5/9; 

pour faire la conversion en ligne Fahrenheit vers Celsius. C'est aussi pourquoi nous 
avons pu ecrire plus haut dans ce chapitre : 

chop($nombre = <STDIN>); 

pour que la valeur finale de $nombre soit modifiee par chop. Pour resumer, on peut uti- 
liser cette fonctionalite chaque fois que Ton veut faire une copie suivie d'une modifica- 
tion de variable. 

Ce true peut etre utilise pour faire deux choses sur la meme ligne Perl. 

Operateurs arithmetiques unaires 

Comme si $variable += 1 n'etait pas assez court, Perl emprunte au C un moyen encore 
plus concis d'incrementer une variable. Les operateurs d'autoincrementation et d'auto- 
decrementation ajoutent (ou soustraient) un a la valeur de la variable. lis peuvent etre 
places avant ou apres cette variable, ce qui determine le moment de leur evaluation. 



Exemple 


Nom 


Resultat 


++$a, $a++ 


Autoincrementation 


Ajouter 1 a $a. 


--$a, $a-- 


Autodecrementation 


Soustraire 1 de $a. 



Si Ton place Fun des operateurs auto avant la variable, il s'agit d'une variable preincre- 
mentee (ou predecrementee). Sa valeur sera modifiee avant son referencement. S'il est 



17. Vous ne l'avez pas oublie ? 

18. Ce qui diffire du Pascal, par exemple, oil l'affectation est une instruction et n'a pas de valeur. 
Nous avons dit que l'affectation est comme un procedure, mais souvenez-vous qu'en Perl les pro- 
cedures aussi ont une valeur. 
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place apres la variable, il s'agit d'une variable post-incrementee (ou post-decrementee) 
et sa valeur est modifiee apres son utilisation. Par exemple : 

$a = 5; # $a prend la valeur 5 

$b = ++$a; # $b prend la valeur incremented de $a, soit 6 
$c = $a--; # $c prend la valeur 6, puis $a passe a 5 

La ligne 15 de notre exemple de notation incremente de un le nombre de notes, afm 
que nous puissions calculer la moyenne. Nous utilisons un operateur de postincremen- 
tation ($scores++), mais cela n'a pas d'importance dans ce cas puisque l'expression se 
trouve dans un contexte vide, ce qui n'est qu'une facon particuliere de dire que l'expres- 
sion n'est evaluee que pour l'effet secondaire de Fincrementation de la variable. La va- 
leur renvoyee est jetee au panier. 19 

Operateurs logiques 

Les operateurs logiques, que Ton connait egalement sous le nom d'operateurs « court- 
circuit », permettent au programme de prendre des decisions en fonction de criteres 
multiples sans utiliser les conditionnelles imbriquees. On les appelle court-circuit car ils 
arretent 1'evaluation de leur argument de droite si l'argument de gauche suffit a deter- 
miner la valeur globale. 

Perl a en fait deux ensembles d'operateurs logiques : l'un d'eux, plutot poussiereux, em- 
prunte au C, et un superbe ensemble tout neuf d'operateurs a precedence ultra-basse 
qui analysent plus comme ce qu'on en attend (mais ils se comportent de la meme facon 
une fois analyses). Perl possede deux ensembles d'operateurs logiques, l'un dit tradition- 
nel emprunte au C, l'autre avec une precedence encore plus faible venant du BASIC. 
L'un a la precedence la plus forte des operateurs du langage, l'autre la plus faible. Sou- 
vent les expressions sont equivalentes, c'est une question de preferences. (Pour une com- 
paraison, voir la section And, or, not etxor logiques au chapitre 3.) Bien qu'ils ne sont pas 
interchangeables, a cause de la precedence, une fois parses ils s'executent avec le meme 
code. La precedence precise l'etendue locale de arguments. 



Tableau 1-1. Operateurs logiques 



Exemple 


Nom 


Resultat 


$a && $b 


Et 


$a si $a est faux, $b sinon. 


$a || $b 


Ou 


$a si $a est vrai $b sinon. 


! $a 


Non 


Vrai si $a n'est pas vrai. 


$a and $b 


Et 


$a si $a est faux, $b sinon. 


$a or $b 


Ou 


$a si $a est vrai, $b sinon. 


not $a 


Non 


Vrai si $a n'est pas vrai. 


$a xor $b 


Ou exclusif 


Vrai si $a ou $b est vrai, mais pas les deux. 



19. Et en fait, Foptimisateur le remarque et optimise la post-incrementation en preincrementa- 
tion, qui est un peu plus efficace a l'execution (ce que vous n'avez pas vraiment besoin de savoir, 
mais nous pensions que cela pouvait vous interesser). 
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Puisque les operateurs logiques « court-circuitent », ils sont souvent utilises pour exe- 
cuter du code de maniere conditionnelle. La ligne suivante (de notre exemple de nota- 
tion) essaie d'ouvrir le fichier « notes ». Si elle peut ouvrir le fichier, elle saute a la ligne 
suivante du programme. Dans le cas contraire, elle affiche un message d'erreur et arrete 
l'execution. 

open(N0TES, "notes") or die "Ouverture du fichier notes impossible: $!\n"; 

Litteralement, « Ouvrir notes ou mourir ! » est encore un exemple de langage naturel, 
et les operateurs de court-circuit preservent le flux visuel. Les actions importantes sont 
listees en bas a gauche de l'ecran et les actions secondaires sont cachees a droite. (La va- 
riable $ ! contient le message d'erreur renvoye par le systeme d'exploitation ; voir le cha- 
pitre 28, Noms speciawc.) Bien star, ces operateurs logiques peuvent aussi etre employes 
dans des constructions plus traditionnelles, comme les instructions if et while. 

Operateurs de comparaison 

Les operateurs de comparaison, ou relationnels, nous indiquent la relation existant en- 
tre deux valeurs scalaires (nombres ou chaines). II existe deux ensembles d'operateurs, 
dont l'un effectue les comparaisons numeriques et l'autre des comparaisons de chaines. 
(Dans les deux cas, les arguments seront d'abord transtypes, « contraints », pour pren- 
dre le bon type.) Le tableau suivant suppose que $a et $b sont respectivement les argu- 
ments de gauche et de droite. 



Comparaison 


Numerique 


Chaine 


Valeur de retour 


egal 




eq 


Vrai si $a est egal a $b. 


Different 


! = 


ne 


Vrai si $a n'est pas egal a $b. 


Inferieur a 


< 


It 


Vrai si $a est plus petit que $b. 


Superieur a 


> 


gt 


Vrai si $a est plus grand que $b. 


Inferieur ou egal a 


<= 


le 


Vrai si $a est inferieur ou egal a $b. 


Superieur ou egal a 


>= 


ge 


Vrai si $a est superieur ou egal a $b. 


Comparaison 


<=> 


cmp 


0 si egal, 1 si $a sup., -1 si $b sup. 



On peut penser que les deux derniers operateurs (<=> et cmp) sont entierement redon- 
dants. Vous avez raison. Cependant, ils sont incroyablement utiles dans les sous-pro- 
grammes de tri (sort). 20 



20. Certains voient en la redondance le mal incarne car elle interdit a un langage d'etre minima- 
liste, ou « orthogonal ». Mais Perl n'est pas orthogonal, il est « diagonal ». Nous entendons par 
ceci que Perl ne vous force pas a tourner sans arret a angle droit. II vaut parfois mieux suivre 
l'hypothenuse du triangle pour aller oil Ton veut. Qui dit TMTOWTDI dit courts-circuits. Qui 
dit courts-circuits dit efficacite. 



Structures de contrdle 



25 



Operateurs de tests defichier 

Les operateurs de tests de fichier permettent de tester si certains attributs de fichier sont 
positionnes avant de faire aveuglement n'importe quoi avec ces fichiers. Par exemple, il 
vaut mieux s'assurer que le fichier /etc/passwd existe deja avant de l'ouvrir en creation, 
effacant ainsi tout ce qui s'y trouvait auparavant. 



Exemple 


Nom 


Resultat 


-e 


$a 


Existe 


Vrai si le fichier nomme par $a existe. 


-r 


$a 


Lecture 


Vrai si le fichier nomme par $a est accessible en lecture. 


-w 


$a 


Ecriture 


Vrai si le fichier nomme par $a est accessible en ecriture. 


-d 


$a 


Repertoire 


Vrai si le fichier nomme par $a est un repertoire. 


-f 


$a 


Fichier 


Vrai si le fichier nomme par $a est un fichier regulier. 


-T 


$a 


Fichier texte 


Vrai si le fichier nomme par $a est un fichier texte. 



En voici quelques exemples : 

-e "/usr/bin/perl" or warn "Perl est mal installe\n"; 

-f "/boot" and print "Felicitations, nous devons etre sous Unix BSD\n"; 

Remarquez qu'un fichier regulier n'est pas la meme chose qu'un fichier texte. Les fi- 
chiers binaires comme /vmunix sont des fichiers reguliers, mais ne sont pas des fichiers 
texte. Les fichiers texte sont l'inverse des fichiers binaires, alors que les fichiers reguliers 
sont l'inverse des fichiers « irreguliers » comme les repertoires et les peripheriques. 

II existe beaucoup d'operateurs de test de fichier, dont un grand nombre n'ont pas ete ci- 
tes. La plupart sont des operateurs booleens unaires : ils ne prennent qu'un seul operan- 
de, un scalaire qui donne un fichier ou un handle de fichier, et ils renvoient une valeur 
vraie ou fausse. Quelques-uns renvoient une valeur plus complexe comme la taille du 
fichier ou son age, mais vous pourrez les rechercher en temps utile dans la section Ope- 
rateurs unaires nommes et de test de fichier au chapitre 3. 

Structures de contrdle 

Jusqu'ici, et hormis notre programme de notation, tous nos exemples etaient complete- 
ment lineaires ; toutes les commandes etaient executees dans Fordre. Nous avons vu 
quelques exemples d'utilisation des operateurs court-circuit permettant Fexecution con- 
ditionnelle d'une commande. Bien que certains programmes lineaires s'averent extre- 
mement utiles (c'est le cas de beaucoup de scripts CGI), on peut ecrire des programmes 
bien plus puissants grace aux expressions conditionnelles et aux mecanismes de boucles, 
que Ton appelle structures de contrdle. Perl peut done etre considere comme un langa- 
ge de controle. 

Mais pour controler le cours des choses, il faut etre en mesure de decider, et pour deci- 
der des choses, il faut distinguer le vrai du faux. 



26 



Chapitre 1 — Vue d'ensemble 



Qu'est-ce que la verite ? 

Nous avons deja parle de la verite 21 et nous avons mentionne que certains operateurs 
renvoient une valeur vraie ou fausse. Avant de continuer, nous devons expliquer exacte- 
ment ce que nous entendons par la. Perl ne traite pas tout a fait la verite comme les 
autres langages informatiques, mais son comportement prend tout son sens avec un peu 
d'habitude. (En fait, nous esperons qu'il prendra tout son sens apres avoir lu ce qui suit.) 

A la base, Perl estime que la verite est « evidente en soi ». C'est une facon un peu spe- 
cieuse de dire que Ton peut evaluer presque n'importe quoi pour connaitre sa valeur de 
verite. Perl emploie en pratique des definitions de la verite qui dependent du type de ce 
que Ton est en train d'evaluer. II se trouve qu'il existe beaucoup plus de types de verite 
que de types de non-verite. 

La verite en Perl est toujours evaluee dans un contexte scalaire (sinon, aucun transtypa- 
ge n'est effectue). Voici done les regies des divers types de valeurs qu'un scalaire peut 
contenir : 

1. Toute chaine est vraie sauf " " et "0". 

2. Tout nombre est vrai sauf 0. 

3. Toute reference est vraie. 

4. Toute valeur indefinie est fausse. 

En fait, les deux dernieres regies peuvent etre derivees des deux premieres. Toute refe- 
rence (regie 3) pointe vers quelque chose avec une adresse, et donne un nombre ou une 
chaine contenant cette adresse, qui n'est jamais nulle. Et toute valeur indefinie (regie 4) 
donne 0 ou la chaine nulle. 

Et d'une certaine maniere, il est possible de faire deriver la regie 2 de la regie 1 si Ton 
pose que tout est une chaine. Encore une fois, aucun transtypage n'est effectue pour eva- 
luer la verite, mais meme si e'etait le cas, une valeur numerique de 0 donnerait simple- 
ment la chaine "0" et serait fausse. Tout autre nombre donnerait autre chose et serait 
vrai. Quelques exemples nous permettront de saisir un peu mieux ce que cela implique : 

0 # deviendrait la chaine "0", done faux 

1 # deviendrait la chaine "1", done vrai 

10-10 # 10-10 vaut 0, deviendrait la chaine "0", done faux 

0.00 # devient 0, et done la chaine "0", done faux 

"0" # la chaine "0", done faux 

"" # une chaine nulle, done faux 

"0.00" # la chaine "0.00", ni vide, ni vraiment "0", done vrai 

"0.00" + 0 # le nombre 0 (transtype par +), done faux 

\$a # une reference a $a, done vrai, meme si $a est faux 

undef() # une fonction renvoyant la chaine indefinie, done faux 

Comme nous avons deja dit que la verite etait evaluee dans un contexte scalaire, on peut 
se demander quelle serait la valeur d'une liste. En fait, il n'existe pas d'operation ren- 
voyant une liste dans un contexte scalaire. Toutes renvoient une valeur scalaire et il suf- 
fit d'appliquer les regies de verite a ce scalaire. II n'y a done pas de probleme, tant que 
Ton sait ce qu'un operateur donne renvoie dans un contexte scalaire. 



21. A dire vrai, ce n'est pas tout a fait exact. 
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Les instructions if et unless 

Nous avons vu plus haut comment un operateur logique pouvait fonctionner comme un 
conditionnel. Une forme un peu plus complexe des operateurs logiques est l'instruction 
if. Celui-ci evalue une condition de verite et execute un bloc si la condition est vraie. 

if ($debug_level > 0) { 

# Quelque chose ne va pas. II faut avertir l'utilisateur. 
print "Debug: Danger, Arthur Accroc, danger!\n"; 
print "Debug: La reponse est '54' au lieu de '42'. \n"; 

} 

Un bloc consiste en une ou plusieurs instructions regroupees par un ensemble d'acco- 
lades. Puisque l'instruction if execute un bloc, les accolades sont necessaires par defini- 
tion. Dans un langage comme le C, on constate une certaine difference. Les accolades 
sont optionnelles s'il n'y a qu'une ligne de code, ce qui n'est pas le cas en Perl. 

Parfois, il ne suffit pas d'executer un bloc quand une condition est remplie. On desire 
egalement executer un autre bloc quand la condition n'est pas remplie. Bien que Ton 
puisse evidemment employer deux instructions if, l'une etant la negation de l'autre, 
Perl fournit une solution plus elegante. Apres le bloc, if peut prendre une deuxieme 
condition optionnelle, appelee else, qui n'est executee que si la conditionnelle est faus- 
se (les veterans de 1'informatique n'en seront pas surpris). 

En d'autres occasions, vous pouvez meme avoir plus de deux choix possibles. En ce cas, 
il est possible d'ajouter une conditionnelle elsif pour les autre choix possibles (les ve- 
terans de 1'informatique s'etonneront a bon droit de la facon d'ecrire « elsif », mais 
personne ici ne s'en excusera). 

if ($city eq "Lille") { 

print "Lille est au nord de Paris. \n"; 

} 

elsif ($city eq "Nancy") { 

print "Nancy est a l'est de Paris. \n"; 

} 

elsif ($city eq "Bayonne") { 

print "Bayonne est au sud-ouest de Paris. Et il y fait plus chaud!\n"; 

} 

else { 

print "De ne sais pas ou se trouve $city, desoleAn"; 

} 

Les clauses if et elsif sont calculees chacune a leur tour, jusqu'a ce que l'une d'entre 
elles soit vraie ou que la condition else soit atteinte. Quand l'une de ces conditions est 
vraie, son bloc est execute et toutes les branches restantes sont sautees. Parfois, on ne 
veut faire quelque chose que si la condition est fausse, et rien si elle est vraie. Un if vide 
avec un else n'est pas tres propre, et la negation d'un if peut etre illisible ; il est dom- 
mage d'ecrire « faire quelque chose si pas ceci est vrai ». Dans ce cas, on peut utiliser 
l'instruction unless. 

unless ($destination eq $maison) { 

print "De ne rentre pas a la maison.Xn"; 

} 

II n'existe pas de elsunless. II s'agit la d'une caracteristique. 
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Constructions iteratives (en boucle) 

Perl possede quatre types principaux d'instructions iteratives : while, until, for et 
foreach. Ces instructions permettent a un programme Perl d'executer de facon repeti- 
tive le meme code pour differentes valeurs. 

Les instructions while et until 

Les instructions while et until fonctionnent de la meme maniere que les instructions 
if et unless, sauf qu'ils repetent l'execution du bloc en bouclant. D'abord, la partie con- 
ditionnelle d'une instruction est verifiee. Si la condition est remplie (si elle est vraie 
pour un while ou fausse pour un until), le bloc de l'instruction est execute. 

while ($tickets_vendus < 10000) { 
$dispo = 10000 - $tickets_vendus; 

print "$dispo tickets sont disponibles. Combien en voulez -vous: "; 
$achat = <STDIN>; 
chomp($achat); 
$tickets_vendus += $achat; 

} 

Remarquez que si la condition originelle n'est pas remplie, on ne rentrera jamais dans 
la boucle. Par exemple, si nous avons deja vendu 10 000 tickets, nous voulons que la li- 
gne suivante du programme affiche quelque chose comme : 

print "Ce spectacle est complet, revenez plus tard.W; 

Dans notre exemple de notation, on voit a la ligne 4 : 

while ($ligne = <N0TES>) { 

ce qui assigne la ligne suivante a la variable $ligne, et comme nous l'avons explique plus 
haut, renvoie la valeur de $ligne afin que la condition de l'instruction while puisse 
evaluer la verite de $ligne. On peut se demander si Perl obtient un « faux »\ sur les li- 
gnes vides et sort prematurement de la boucle. La reponse est non. La raison en est sim- 
ple, si vous vous reportez a tout ce que nous en avons dit. L'operateur d'entree de ligne 
laisse le saut de ligne a la fin de la chaine, ce qui fait qu'une ligne vide comporte la va- 
leur "\n". Et vous savez que "\n" n'est pas une des valeurs canoniques de faussete. La 
condition est done vraie et la boucle continue meme pour les lignes vides. 

En revanche, quand nous atteignons la fin du fichier, l'operateur d'entree de ligne ren- 
voie la valeur indefinie, qui donne toujours faux. Et la boucle se termine ainsi au mo- 
ment desire. Ce programme Perl n'a pas besoin d'un test explicite sur la fonction eof, 
parce les operateurs d'entree sont concus pour fonctionner sans douleur dans un con- 
texte conditionnel. 

En fait, presque tout est concu pour fonctionner sans douleur dans un contexte condi- 
tionnel. Par exemple, un tableau dans un contexte scalaire renvoie sa longueur. On voit 
done frequemment ce genre de choses : 

while (@ARGV) { 

process(shift (9ARGV); 

} 

La boucle sort automatiquement quand @ARGV est epuise. L'operateur shift retire un 
element de la liste argument a chaque boucle et retourne cet element. La boucle s'arrete 
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automatiquement lorsque le tableau @ARGV est vide, done de longueur 0 qui a pour va- 
leur booleenne 0. 22 

^instruction for 

Un autre traitement iteratif est la boucle for. Une boucle for tourne exactement com- 
me la boucle while, mais parait tres differente (bien qu'elle dise quelque chose aux pro- 
grammeurs C). 

for ($vendu = 0; $vendu < 10000; $vendu += $achat) { 
$dispo = 10000 - $venduj 

print "$dispo tickets sont disponibles. Combien en voulez-vous: "; 

$achat = <STDIN>; 

chomp($achat); 

} 

La boucle for prend trois expressions entre les parentheses de la boucle : une expression 
pour initialiser l'etat de la variable de boucle, une condition pour tester la variable et 
une expression pour modifier l'etat de la variable. Quand la boucle commence, la varia- 
ble est initialisee et la condition est verifiee. Si elle est vraie, le bloc est execute. Quand 
le bloc se termine, l'expression de modification est executee, la condition est de nou- 
veau verifiee et si elle est vraie, le bloc est reexecute avec les nouvelles valeurs. Tant que 
la condition reste vraie, le bloc et l'expression de modification continuent a etre execu- 
tes. (Notez que seule la valeur de l'expression du milieu est evaluee et memorisee, les 
deux autres ne sont utilisees que comme effet de bord, et ne sont pas memorisees.) 

^instruction foreach 

La derniere des principales instructions iteratives est Finstruction foreach. foreach est 
utilisee pour executer le meme code pour chacun des elements d'un ensemble connu 
de scalaires, comme un tableau : 

foreach $user ((Susers) { 

if (-f "$home{$user}/.nexrc") { 

print "$user est un type bien... il utilise un vi qui 
comprend Perl!\n"; 

} 

} 

A la difference des conditionnelles if et while, qui induisent un contexte scalaire dans 
l'expression, Finstruction foreach induit un contexte de liste dans l'expression entre pa- 
rentheses. Ainsi l'expression s'evalue en une liste (meme si cette liste ne contient qu'un 
scalaire). Chaque element de la liste est tour a tour mis dans la variable de boucle et le 
bloc de code est execute une fois par element. Remarquez que la variable de boucle de- 
vient une reference a l'element lui-meme, et non une copie de l'element. La modifica- 
tion de cette variable modifie done le tableau originel. 



22. C'est ainsi qu'on raisonne en Perl. II n'est pas necessaire de comparer 0 avec 0 pour savoir que 
e'est faux. Si certains langages vous y obligent, ne vous egarez pas a faire la comparaison explicite 
while (@ARGV != 0). C'est une perte de temps pour vous et le calculateur, aussi bien que pour la 
maintenance. 
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On trouve beaucoup plus de boucles foreach dans un programme Perl typique que 
dans des boucles for, car il est tres facile en Perl de generer les listes que demande 
foreach. Une tournure que Ton rencontre frequemment est une iteration bouclant sur 
les clefs triees d'un hachage : 

foreach $clef (sort keys %hash) { 

Ce qui est exactement le cas de la ligne 9 de notre exemple de notation. 

Pour s'en sortir : next et last 

Les operateurs next et last permettent de modifier le flux de votre boucle. II n'est pas 
rare de rencontrer un cas special ; on peut vouloir le sauter, ou quitter la boucle quand 
on le rencontre. Par exemple, si Ton gere des comptes UNIX, on peut vouloir sauter les 
comptes systeme comme root ou Ip. L'operateur next permet de sauter a la fin de l'ite- 
ration courante et d'en commencer une nouvelle. L'operateur last permet de sauter a 
la fin du bloc comme si la condition du test avait renvoye faux, par exemple dans le cas 
oil Ton cherche un compte specifique et que Ton veut quitter aussitot qu'on Fa trouve. 

foreach $user ((ffiusers) { 

if ($user eq "root" or $user eq "lp") { 
next; 

} 

if ($user eq "special") { 

print "Compte special trouve. \n"; 

# Traitement 

last; 

} 

} 

Il est possible de sortir de boucles imbriquees en les etiquetant et en specifiant celles 
dont on veut sortir. Les modificateurs d'instruction (une autre forme de conditionnelle 
dont nous n'avons pas encore parle) associes a ceci peuvent fournir des sorties de bou- 
cles tres lisibles, pour autant que le francais ou l'anglais soient lisibles : 

LIGNE: while ($ligne = <ARTICLE>) { 

last LIGNE if $ligne eq "\n"; # arret sur la premiere ligne vide 
next LIGNE if / A #/; # sauter les lignes de commentaire 

# ici, votre publicite 

} 

Vous devez vous dire, « Une minute, la, qu'est ce que ce true bizarre, A #, entre ces especes 
de cure-dents ? Cela ne ressemble pas a du langage naturel. ». Vous avez mille fois rai- 
son. II s'agit d'une recherche de correspondance contenant une expression rationnelle 
(bien qu'elle soit plutot simple). Et e'est ce dont parle la section suivante. Perl est avant 
tout un langage de traitement de texte, et les expressions rationnelles sont au cceur de 
ces fonctionnalites. 

Expressions regulieres 

Les expressions regulieres (aussi expressions rationnelles, regexps ou bien RE) sont utili- 
ses par la plupart des processeurs de texte du monde UNIX : grep et findstr, sed et aivk, 
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et les editeurs tels vi et emacs. Une expression reguliere est l'ecriture concise d'un ensem- 
ble de chaines. 23 

La plupart des autres langages integrent aussi le traitement des RE, mais aucun d'eux 
ne le fait a la maniere de Perl. Les expressions rationnelles sont employees de plusieurs 
manieres dans Perl. Elles sont utilisees en premier lieu dans des conditionnelles pour 
determiner si une chaine correspond a un motif donne. Quand on voit quelque chose 
qui ressemble a /machin/, on sait qu'il s'agit d'un operateur de recherche de corresponden- 
ce ordinaire. 

if (/Windows 95/) { print "II est temps de faire une mise a jour ?\n" } 

Ensuite, si Ton peut retrouver des motifs dans une chaine, on peut les remplacer par 
quelque chose d'autre. Par exemple, s/machin/bidule/ demande de substituer 
« bidule » a « machin », si cela est possible. Nous appelons cela l'operateur de substitu- 
tion. Une RE peut aussi s'evaluer en un booleen, mais e'est l'effet de bord qui est utilise 
la plupart du temps. 

s/Windows/Linux/; 

Enfin, les motifs peuvent non seulement specifier l'emplacement de quelque chose, 
mais egalement les endroits oil il ne se trouve pas. L'operateur split emploie done une 
expression rationnelle pour specifier les emplacements d'oii les donnees sont absentes. 
Autrement dit, l'expression rationnelle definit les delimiteurs qui separent les champs 
de donnees. Notre exemple de notation en comporte quelques exemples simples. Les li- 
gnes 5 et 12 eclatent les chaines sur le caractere espace pour renvoyer une liste de mots. 
Mais split permet d'eclater sur tout delimiteur specifie par une expression rationnelle. 

($bon, $brute, $truand) = split(/,/, "vi, emacs, teco"); 

II existe de nombreux modificateurs utilisables dans chacun de ces contextes pour faire 
des choses plus exotiques comme l'indifferenciation des majuscules et des minuscules 
en recherchant des chaines de caracteres, mais ce sont la des details que nous couvrirons 
au chapitre suivant. 

L'usage le plus simple des expressions rationnelles consiste a rechercher une expression 
litterale. Dans le cas des eclatements que nous venons de mentionner, nous avons re- 
cherche un simple espace. Mais si Ton recherche plusieurs caracteres a la fois, ils doivent 
tous correspondre en sequence. C'est-a-dire que le motif correspond a une sous-chaine, 
comme Ton peut s'y attendre. Admettons que nous desirions montrer toutes les lignes 
d'un fichier HTML representant des liens vers d'autres fichiers HTML (en excluant les 
liens FTP). Imaginons que nous travaillions en HTML pour la premiere fois et que nous 
soyons done un peu naifs. Nous savons que ces liens contiendront toujours la chaine 
« http : ». Nous pouvons boucler dans le fichier comme ceci : 24 



23. Une bonne introduction est le livre de Jeffrey Friedl, Maitrise des expressions regulieres (Edi- 
tions O'Reilly). 

24. Cela ressemble beaucoup a la commande UNIX grep 'http: ' fichier. Sous MS-DOS, il est 
possible d'employer la commande find, mais elle ne sait pas traiter d'expression plus complexe. 
(Cependant, le programme — improprement nomme — findstr de Windows NT comprend les 
expressions rationnelles.) 
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while ($ligne = <FICHIER>) { 
if ($ligne =~ /http:/) { 
print $ligne; 

} 

} 

Ici, le =~ (operateur de liaison de motif) indique a Perl qu'il doit rechercher l'expression 
rationnelle http: dans la variable $ligne. S'il trouve l'expression, l'operateur renvoie 
une valeur vraie et le bloc (une commande d'affichage) est execute. 

Au fait, si Ton n'utilise pas l'operateur de liaison =~, Perl recherchera un motif par de- 
faut au lieu de $ligne. Ce motif par defaut n'est en fait qu'une variable speciale qui 
prend le nom curieux de $_. En fait, de nombreux operateurs emploient la variable $_ 
et un expert de la programmation Perl peut ecrire ce qui precede comme : 

while (<FICHIER>) { 
print if /http:/; 

} 

(Hmm, un autre modificateur d'instruction semble etre apparu ici. Insidieuses bestio- 
les...) 

Tout cela est bien pratique, mais si nous voulons trouver tous les liens, et non les seuls 
HTTP ? Nous pouvons en donner une liste comme « http: », « ftp: », « mailto: », 
etc. Mais cette liste peut etre longue, et que faire si un nouveau type de lien est ajoute ? 

while (<FILE>) { 

print if /http:/; 
print if /ftp:/; 
print if /mailto:/; 
# Et apres? 

} 

Comme les expressions rationnelles decrivent un ensemble de chaihes, nous pouvons 
nous contenter de decrire ce que nous cherchons : un certain nombre de caracteres al- 
phabetiques suivis d'un deux-points. Dans le dialecte des expressions rationnelles (le 
regexpais ?), ce serait /[a-zA-Z] + : /, oil les crochets definissent une classe de caracteres. 
Les a-z et A-Z representent tous les caracteres alphabetiques (le tiret representant l'in- 
tervalle de caracteres entre le caractere de debut et celui de fin, inclus). Et le + est un 
caractere special disant « un ou plusieurs exemplaires du machin qui se trouve avant 
moi ». II s'agit d'un quantificateur, qui indique combien de fois quelque chose peut etre 
repete. (Les barres obliques ne font pas vraiment partie de l'expression rationnelle, mais 
plutot de l'operateur de correspondance. Elles n'agissent que comme delimiteurs de l'ex- 
pression rationnelle). 

Certaines classes, comme la classe alphabetique, etant frequemment utilisees, Perl defi- 
nit des cas speciaux, qui comprennent : 



Nom 


Definition ASCII 


Caractere 


espace 


[ \t\n\r\f] 


\s 


Caractere de mot 


[a-zA-Z_0-9] 


\w 


Chiffre (digit) 


[0-9] 


\d 
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Remarquez qu'ils ne correspondent qu'a des caracteres simples. Un \w recherchera un 
unique caractere de mot et non un mot complet. (Vous souvenez-vous du quantificateur 
+ ? On peut ecrire \w+ pour rechercher un mot.) Perl fournit egalement la negation de 
ces classes en employant le caractere en majuscule, comme \D pour un caractere qui 
n'est pas un chiffre. 

(II faut remarquer que \w n'est pas toujours equivalent a [a -zA-Z_0-9]. Certains locales 
definissent des caracteres alphabetiques supplementaires hors de la sequence ASCII, et 
\w les respecte.) 25 Certaines langues definissent des caracteres alphabetiques au-dela de 
la sequence ASCII classique. Le code \w les prend en compte. Les recentes versions de 
Perl connaissent aussi le codage UNICODE avec les proprietes numeriques et Perl traite 
ce codage avec les proprietes en consequence. (II considere aussi les ideogrammes com- 
me des caracteres \w.) 

II existe une autre classe de caracteres tres speciale, que Ton ecrit « . », qui recherchera 
tout caractere. 26 Par exemple, /a . / trouve toute chame contenant un « a » qui n'est pas 
le dernier caractere de la chaine. II trouvera done « at » ou « am », ou meme « a+ », 
mais non « a » puisqu'il n'y a rien apres le « a » qui puisse correspondre au point. Com- 
me il cherche le motif n'importe ou dans la chaine, il le trouvera dans « oasis » et dans 
« chameau », mais non dans « sheba ». II trouvera le premier « a » de « caravane ». II 
pourrait trouver le deuxieme, mais il s'arrete apres la premiere correspondance en cher- 
chant de gauche a droite. 

Quantificateurs 

Les caracteres et les classes de caracteres dont nous avons parle recherchent des caracte- 
res uniques. Nous avons deja mentionne que Ton pouvait rechercher plusieurs caracte- 
res « de mot » avec \w+ pour correspondre a un mot complet. Le + est un de ces 
quantificateurs, mais il y en a d'autres (tous sont places apres l'element quantifie). 

La forme la plus generale de quantificateur specifie le nombre minimal et le nombre 
maximal de fois auquel un element peut correspondre. Les deux nombres sont mis en- 
tre accolades, separes par une virgule. Par exemple, pour essayer de trouver les numeros 
de telephone d'Amerique du Nord, Ad{7, 11}/ rechercherait au moins 7 chiffres, mais 
au plus 11 chiffres. Si un seul chiffre se trouve entre les accolades, il specifie a la fois le 
minimum et le maximum ; e'est-a-dire que le nombre specifie le nombre exact de fois 
que l'element peut etre repete. (Si Ton y ref lechit, tous les elements non quantifies ont 
un quantificateur implicite {l}.) 

Si Ton met le minimum et la virgule en omettant le maximum, ce dernier passe a l'in- 
fini. En d'autres termes, le quantificateur indique le nombre minimum de caracteres, et 
tout ceux qu'il trouvera apres cela. Par exemple, Ad{7}/ ne trouvera qu'un numero de 
telephone local (d'Amerique du Nord, a sept chiffres), alors que Ad{7, }/ correspondra 
a tous les numeros de telephones, meme les internationaux (sauf ceux qui comportent 
moins de 7 chiffres). II n'existe pas de facon specifique d'ecrire « au plus » un certain 
nombre de caracteres. II suffit d'ecrire, par exemple, / . {0, 5 }/ pour trouver au plus cinq 
caracteres quelconques. 



25. Ce qui est bien pratique pour rechercher les caracteres accentues en francais. (N.d.T.) 

26. Mais il ne trouvera pas un saut de ligne. Quand on y pense, un « . » ne correspond pas non 
plus a un saut de ligne dans grep(l). 
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Certaines combinaisons de minimum et de maximum apparaissant frequemment, Perl 
definit des quantificateurs speciaux. Nous avons deja vu +, qui est identique a {l,}, 
c'est-a-dire « au moins une occurrence de l'element qui precede ». II existe aussi *, qui 
est identique a {0, }, ou « zero occurrence ou plus de l'element qui precede », et ?, iden- 
tique a {0,1}, ou « zero ou une occurrence de l'element qui precede » (l'element qui 
precede est done optionnel). 

II faut savoir deux ou trois choses concernant la quantification. D'abord, les expressions 
rationnelles de Perl sont, par defaut, avides. Cela signifie qu'elles essayent de trouver une 
correspondance tant que l'expression entiere correspond toujours. Par exemple, si Ton 
compare Ad+ a « 1234567890 », cela correspondra a la chaine entiere. II faut done spe- 
cialement surveiller l'emploi de « . », tout caractere. On trouve souvent une chaine 
comme : 

larry : DYHtPhO. /NDTU: 100: 10: Larry Wall: /home/larry : /bin/tcsh 

ou on essaye de trouver « larry » avec /. + :/. Cependant, comme les expressions ration- 
nelles sont avides, ce motif correspond a tout ce qui se trouve jusqu'a « /home/larry » 
inclus. On peut parfois eviter ce comportement en utilisant une negation de classe de ca- 
racteres, par exemple avec /[\ A : ] + :/, qui indique de rechercher un ou plusieurs carac- 
teres non-deux-points (autant que possible), jusqu'au premier deux-points. C'est le petit 
chapeau qui inverse le sens de la classe de caracteres. 27 L'autre point a surveiller est que 
les expressions rationnelles essayent de trouver une correspondance des que possible. Ce 
point est mime plus important que l'avidite. Le balayage se produisant de gauche a 
droite, cela veut dire que le motif cherchera la correspondance la plus a gauche possible, 
meme s'il existe un autre endroit permettant une correspondance plus longue (les ex- 
pressions rationnelles sont avides, mais elles voient a court terme). Par exemple, suppo- 
sons que Ton utilise la commande de substitution si 1 1 sur la chaine par defaut (a savoir 
la variable $_), et que Ton veuille enlever une suite de x du milieu de la chaine. Si Ton 
ecrit : 

$_ = "fred xxxxxxx barney"; 
s/x*//; 

cela n'aura aucun effet. En effet, le x* (voulant dire zero caracteres « x » ou plus) trou- 
vera le « rien » au debut de la chaine, puisque la chaine nulle est large de zero caracteres 
et que Ton trouve une chaine nulle juste avant le « f » de « fred » 28 

Encore une chose a savoir. Par defaut, les quantificateurs s'appliquent a un caractere 
unique les precedant, ce qui fait que /bam{2}/ correspond a « bamm » mais pas a 
« bambam ». Pour appliquer un quantificateur a plus d'un caractere, utilisez les paren- 
theses. II faut employer le motif /(bam){2}/ pour trouver « bambam ». 

Correspondance minimale 

Si Ton ne voulait pas de « correspondances avides » dans les anciennes versions de Perl, 
il fallait employer la negation d'une classe de caracteres (et en fait, on obtenait encore 
une correspondance avide, bien que restreinte). 



27. Desole, nous n'avons pas invente cette notation, ne nous en voulez pas. II s'agit simplement 
de la facon d'ecrire les expressions rationnelles dans la culture UNIX. 

28. Meme les auteurs s'y font prendre de temps en temps. 
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Les versions modernes de Perl permettent de forcer une correspondance minimale par 
l'emploi d'un point d'interrogation apres tout quantificateur. Notre recherche de nom 
d'utilisateur serait alors /.*?:/. Ce . * ? essaye alors de correspondre a aussi peu de carac- 
teres que possible, au lieu d'autant que possible, et il s'arrete done au premier deux- 
points au lieu du dernier. 

Pour enfoncer le clou 

Chaque fois que Ton cherche a faire correspondre un motif, celui-ci essayera partout jus- 
qu'a ce qu'il trouve une correspondance. Une ancre permet de restreindre l'espace de re- 
cherche. Une ancre est d'abord quelque chose qui ne correspond a « rien », mais il s'agit 
la d'un rien d'un type special qui depend de son environnement. On peut aussi l'appeler 
une regie, une contrainte ou une assertion. Quelle que soit son appellation, elle essaie 
de faire correspondre quelque chose de longueur zero, et reussit ou echoue. (En cas 
d'echec, cela veut surtout dire que le motif ne trouve pas de correspondance de cette fa- 
con. II essaie alors d'une autre maniere, s'il en existe.) 

La chaine de caracteres speciale \b correspond a une limite de mot, qui est definie com- 
me le « rien » entre un caractere de mot (\w) et un caractere de non-mot (\W), dans le 
desordre. (Les caracteres qui n'existent pas de part et d'autre de la chaine sont appeles 
des caracteres de non-mot). Par exemple, 

AbFredW 

correspond a « Le Grand Fred » et a « Fred le Grand » , mais ne correspond pas a 
« Frederic le Grand » parce que le « de » de Frederic ne contient pas de limite de mot. 

Dans une veine similaire, il existe egalement des ancres pour le debut et la fin d'une 
chaine. S'il s'agit du premier caractere d'un motif, le chapeau ( A ) correspond au « rien » 
au debut de la chaine. Le motif / A Fred/ correspondrait done a « Frederic le Grand » 
et non a « Le Grand Fred », alors que /FredV ne correspondrait a aucun des deux (et 
ne correspondrait d'ailleurs pas a grand-chose). Le signe dollar ($) fonctionne comme le 
chapeau, mais il correspond au « rien » a la fin de la chaine au lieu du debut. 29 

Vous devez maintenant etre en mesure de deviner ce que veut dire : 

next LIGNE if / A #/; 

C'est bien sur « Aller a la prochaine iteration de la boucle LIGNE si cette ligne commence 
par un caractere # ». 

Nous avons dit plus haut que la sequence \d{7, 11} coincide avec un nombre de 7 a 11 
chiffres de long ce qui est vrai mais incomplet: quand cette sequence est utilisee dans 
une expression comme Ad{7,ll}/, ca n'exclue pas d'autres chiffres apres les 11 pre- 
miers. Done, le plus souvent, lorsque vous utilisez des quantificateurs, vous utiliserez 
des ancres de chaque cote. 



29. Tout ceci est un peu simpliste, car nous supposons ici que la chaine ne contient qu'une ligne. 
A et $ sont en fait des ancres au debut et en fin de ligne et non pas de chaine. Nous essaierons de 
clarifier tout cela au chapitre 5, Recherche de motif '(pour autant que Ton puisse clarifier tout cela). 
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References arrieres 

Nous avons deja mentionne que Ton pouvait employer des parentheses pour grouper 
des caracteres devant un quantificateur, mais elles peuvent aussi servir a se souvenir de 
parties de ce qui a ete trouve. Une paire de parentheses autour d'une partie d'expression 
rationnelle permet de se souvenir de ce qui a ete trouve pour une utilisation future. Cela 
ne change pas le motif de recherche, et Ad+ et /(\d+)/ chercheront toujours autant de 
chiffres que possibles, mais dans le dernier cas, ceux-ci seront memorises dans une va- 
riable speciale pour etre « references en arriere » plus tard. 

La facon de referencer la partie memorisee de la chame depend de l'endroit d'oii on ope- 
re. Dans la meme expression rationnelle, on utilise un antislash suivi d'un entier. II cor- 
respond a une paire de parentheses donnee, determinee en comptant les parentheses 
gauches depuis la gauche du motif, en commencant par un. Par exemple, pour recher- 
cher quelque chose ressemblant a une balise HTML (comme « <B>Cras</B> »), on peut 
utiliser /<(.*?)>. *?<\/\l>/. On force alors les deux parties du motif a correspondre 
exactement a la meme chame de caracteres, comme au « B » ci-dessus. 

Hormis l'expression rationnelle elle-meme, comme dans la partie de remplacement 
d'une substitution, la variable speciale est utilisee comme s'il s'agissait d'une variable 
scalaire normale nommee par l'entier. Done, si Ton veut echanger les deux premiers 
mots d'une chame, par exemple, on peut employer : 

s/(\S+)\s+(\S+)/$2 $1/ 

Le cote droit de la substitution equivaut a une sorte de chame protegee par des apostro- 
phes doubles, ce qui explique pourquoi Ton peut y interpoler des variables, y compris 
des references arrieres. Ce concept est puissant : 1' interpolation (sous controle) est une 
des raisons pour lesquelles Perl est un bon langage de traitement de texte. Entre autres 
raisons, on trouve bien entendu les motifs de correspondance. Les expressions rationnel- 
les savent parfaitement extraire des elements et l'interpolation sert a les rassembler. 
Peut-etre existe-t-il enfin un espoir pour Humpty Dumpty. 

Traitement des listes 

Nous avons vu plus haut que Perl connait deux principaux contextes, le contexte scalai- 
re (pour gerer les singularites) et le contexte de liste (pour gerer les pluralites). La plu- 
part des operateurs traditionnels que nous avons decrits jusqu'ici etaient strictement 
scalaires dans leur operation. lis prennent toujours des arguments singuliers (ou des pai- 
res d'arguments singuliers pour les operateurs binaires), et produisent toujours un re- 
sultat singulier, meme dans un contexte de liste. Done, si Ton ecrit ceci : 

@tableau = (l + 2, 3 - A, 5 * 6, 7 / 8); 

on sait que la liste de droite contient exactement quatre valeurs, car les operateurs ma- 
thematiques ordinaires produisent toujours des valeurs scalaires, meme dans le contex- 
te de liste fourni par l'assignation a un tableau. 

Cependant, d'autres operateurs Perl peuvent produire soit un scalaire, soit une liste, se- 
lon le contexte. lis « savent » si vous attendez d'eux un scalaire ou une liste. Mais com- 
ment pouvez-rous le savoir? C'est en fait tres simple une fois que vous vous etes 
familiarises avec quelques concepts clefs. 
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Premierement, le contexte de liste doit etre fourni par quelque chose dans l'« environ- 
nement ». Dans l'exemple ci-dessus, c'est l'assignation de liste qui le fournit. Nous avons 
vu ci-avant que la liste dans l'instruction de boucle f oreach fournit le contexte de liste. 
L'operateur print aussi. II est possible de tous les identifier d'un coup. 

Si vous regardez les nombreuses representations syntaxiques des operateurs dans le reste 
de ce livre, divers operateurs sont dermis pour prendre une LISTE en argument. Ce sont 
les operateurs quifournissent un contexte de liste. Tout au long de ce livre, LISTE est em- 
ploye comme le terme technique signifiant « une construction syntaxique fournissant 
un contexte de liste ». Par exemple, si Ton regarde sort, on trouve le resume de syntaxe 
suivant : 

sort LISTE 

Ce qui veut dire que sort procure un contexte de liste a ses arguments. 

Deuxiemement, a la compilation, tout operateur qui prend une LISTE fournit un con- 
texte de liste a chaque element syntaxique de cette LISTE. Chaque operateur ou entite de 
haut niveau de la LISTE sait qu'il est cense fournir la meilleure liste possible. Cela signifie 
que si Ton ecrit : 

sort @mecs, (Bnanas, autres(); 

@mecs, @nanas et autresQ savent tous qu'ils sont censes fournir une valeur de liste. 

Enfin, a l'execution, chacun de ces elements de LISTE fournit sa liste, puis (ceci est im- 
portant) toutes les listes isolees sont rassemblees, bout a bout, en une liste unique. Et 
cette liste unique, unidimensionnelle, est ce qui est finalement donne a la fonction qui 
voulait une LISTE. Si done @mecs contient (Fred, Barney), (Snanas contient (Wilma, 
Betty), et que la fonction autreQ renvoie la liste a un seul element (Dino), la LISTE 
que voit sort devient : 

(Fred , Barney , Wilma, Betty, Dino) 

et sort renvoie la liste : 

(Barney, Betty, Dino, Fred, Wilma) 

Certains operateurs produisent des listes (comme keys), certains les consomment (com- 
me print) et d'autres les transforment en d'autres listes (comme sort). Les operateurs 
de cette derniere categorie sont considered comme des filtres ; mais contrairement au 
shell, le flux de donnees s'effectue de droite vers la gauche, puisque les operateurs de 
liste agissent sur les elements qui sont passes a leur droite. On peut empiler plusieurs 
operateurs de liste a la fois : 

print reverse sort map {lc} keys %hash; 

Toutes les clefs de %hash sont prises et renvoyees a la fonction map, qui met chacune d'en- 
tre elles en minuscule par l'operateur lc, et les passe a la fonction sort qui les trie et les 
repasse a la fonction reverse, qui renverse l'ordre des elements de la liste, qui les passe 
enfin a la fonction print, qui les affiche. 

C'est, on le voit, beaucoup plus facile a decrire en Perl qu'en francais. 

Nous ne pouvons lister tous les exemples ou l'utilisation de la structure de liste produit 
un code plus naturel a lire. Mais revenons sur les RE un moment. Dans un contexte de 
liste, toutes les coincidences sont memorisees dans les elements successifs de la liste. 
Cherchons, par exemple, toutes les chames de la forme « 12:59:59 am ». On peut le faire 
comme ceci : 
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Chapitre 1 — Vue d'ensemble 



($hour, $min, $sec, $ampm) = /(\d+) : (\d+) : (\d+) *(\w+)/; 

Ce qui est une facon pratique d'instancier plusieurs variables en meme temps. On peut 
aussi ecrire : 

@hmsa = /(\d+):(\d+):(\d+) *(\w+)/; 

et mettre ces 4 valeurs dans un tableau. Etrangement, par la separation de Taction entre 
les RE et les expressions Perl, le contexte de liste augmente les possibilites du langage. 
Nous ne le voyons pas, mais Perl est un veritable langage orthogonal en plus d'etre dia- 
gonal. Allez, on fait une pause ! 

Ce que vous ne savez pas ne vous fern pas 
(trop) de mal 

Enfin, permettez-nous de revenir encore une fois au concept de Perl en tant que langage 
naturel. Les usagers d'un langage naturel ont le droit d'avoir des niveaux d'aptitude dif- 
ferents, de parler differents sous-ensembles de ce langage, d'apprendre au fur et a mesu- 
re et, en general, de Futiliser avant d'en connaitre toutes les arcanes. Vous ne connaissez 
pas tout de Perl, tout comme vous ne connaissez pas tout du francais. Mais ceci est Of- 
ficiellement OK dans la culture Perl. Vous pouvez employer utilement Perl meme si 
nous ne vous avons pas encore appris a ecrire vos propres sous-programmes. Nous avons 
a peine commence a expliquer que Perl pouvait etre vu comme un langage de gestion 
systeme, ou comme un langage de prototypage rapide, ou comme un langage reseau, ou 
comme un langage oriente objet. Nous pourrions ecrire des chapitres entiers sur ces su- 
jets (et a vrai dire, c'est deja le cas). 

Mais au bout du compte, vous devrez creer votre propre vision de Perl. C'est votre pri- 
vilege, en tant qu'artiste, de vous inf liger a vous-meme la douleur de la creativite. Nous 
pouvons vous apprendre notre facon de peindre, mais nous ne pouvons pas vous appren- 
dre votre facon. TMTOWTDI : il existe plus d'une facon de faire. 

Amusez-vous comme il convient. 



II 

Seance de dissection 



2 

Composants de Perl 



Oil nous etudions les elements de l'ensemble. 

Dans les prochains chapitres nous progresserons du particulier vers le general, approche 
ascendante, en commencant par decrire les composants elementaires qui permettront 
d'aborder les structures plus elaborees, un peu a la maniere dont les atomes forment les 
molecules. L'inconvenient est que vous n'en aurez pas necessairement une image globa- 
le sans auparavant avoir ete submerge par de nombreux details, mais l'avantage est que 
vous comprendrez les exemples au fur et a mesure. (si vous preferez l'approche inverse, 
retournez le livre et lisez ce chapitre a Fenvers). 

Chaque chapitre est construit sur le precedent ce qui necessite une lecture lineaire, 
(vous devrez done faire attention si vous etes du genre a sautiller d'une page a l'autre). 

Vous etes invite a utiliser les differentes annexes a la fin du livre. (Ce qui n'est pas du 
sautillement.) Chaque mot distingue par une police type se trouve au chapitre 29, Fonc- 
tions. Bien que nous avons essaye de ne pas privilegier un systeme d'exploitation, si vous 
etes peu au courant de la terminologie Unix et si vous rencontrez un mot qui semble 
dire autre chose que ce que vous pensez, reportez-vous au glossaire. Si cela ne marche 
pas, essayez l'index. 

Atomes 

Le plus petit element visible du langage est le caractere, celui que Ton peut visualiser 
dans un editeur par exemple. Au depart, Perl ne faisait pas la distinction entre octets et 
caracteres ASCII, mais pour des raisons d'internationalisation, il faut bien distinguer les 
deux. 

Le code Perl peut etre ecrit exclusivement en ASCII, mais autorise aussi l'utilisation 
d'un codage sur 8 ou 16 bits, qu'il soit celui d'une langue ou bien de tout autre codage 
defini regulierement, a condition de le faire dans des chaines literales uniquement. Bien 
sur, Perl ne verifiera pas le contenu du texte mais saura simplement qu'un caractere est 
code sur 16 bits. 
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Comme explique au chapitre 15, Unicode, Perl implemente Unicode. C'est transparent 
pour l'utilisateur du langage qui peut en utiliser aussi bien dans des identificateurs 
(noms de variables, etc) que dans des chaines literales. Pour Perl, tous les caracteres ont 
la meme taille de reference, par exemple 1, quelle que soit la representation interne 
qu'il en fait ensuite. En principe, il code les caracteres sous forme UTF-8 et done un ca- 
ractere peut avoir une forme interne sur 1, 2, 3... octets. (L'Unicode smiley U-263A est 
une sequence de 3 octets.) 

Mais poursuivons l'analogie physique un peu plus avant avec les atomes. Les caracteres 
sont atomiques de la meme facon que les atomes codent les differents elements. Un ca- 
ractere est compose de bits et d'octets mais si on le desintegre (dans un accelerateur de 
caracteres, sans doute), il perd toutes ses proprietes propres. De la meme maniere que 
les neutrons composent l'atome d'Uranium U-238, les octets qui composent le caractere 
smiley U-263A sont un detail de son implementation. 

II faut done bien distinguer le mot « caractere » du mot « octet ». C'est pourquoi on 
peut le preciser a l'interpreteur avec la directive use bytes. (Voir le chapitre 31, Modules 
de pragmas). De toute maniere, Perl saura par lui-meme faire le codage sur 8 bits quand 
il le faudra. 

Maintenant passons dans la prochaine dimension. 

Molecules 

Perl est un langage informel, ce qui ne veut pas dire qu'il n'a pas de forme, mais plutot 
dans le sens usuel du terme, e'est-a-dire un langage qu'on peut ecrire avec des espaces, 
tabulations et caracteres de nouvelle ligne partout oil vous voulez sauf dans les unites 
syntaxiques. 

Par definition, un symbole ne contient pas d'espace. Un symbole est une unite syntaxi- 
que avec un sens pour l'interpreteur, comme pour un mot dans une phrase, mais qui 
peut contenir d'autres caracteres que des lettres tant que cette unite n'est pas rompue. 
(Ce sont de vraies molecules qui peuvent utiliser toutes sortes d'atomes. Par exemple, 
les nombres et les operateurs mathematiques sont des symboles. Un identificateur est un 
symbole qui debute par une lettre ou un souligne et qui ne contient que des lettres, chif- 
fres ou soulignes. Un symbole ne peut contenir d'espace puisque le caractere espace cou- 
perait le symbole en deux nouveaux symboles, tout comme un caractere espace, en 
francais couperait un mot en deux nouveaux mots. 2 

Bien que le caractere espace soit necessaire entre deux symboles, les espaces ne sont obli- 
gatoires qu'entre deux symboles qui, sinon, seraient pris pour un seul. A cet effet, tous 
les espaces sont equivalents. Un commentaire est compte comme un espace. Les sauts 
de ligne ne sont differents des espaces qu'entre des delimiteurs, dans certains formats et 
pour des formes orientees ligne de protection. Plus precisement le caractere de saut de 
ligne ne delimite pas une instruction comme en FORTRAN ou en Python. Les instruc- 
tions en Perl se terminent par le caractere « ; » comme en C. 



1. Aussi enthousiaste que nous soyons au sujet d'Unicode, la plupart de nos exemples sont en 
ASCII, etant donne que tout le monde n'a pas necessairement un editeur de texte Unicode. 

2. Dans les chaines literales, c'est le guillemet qui delimite l'unite et non l'espace, on peut done 
y inclure ce caractere. 



Types internes 
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Les caracteres d'espace Unicode sont autorises dans un programme Perl Unicode 
moyennant certaines precautions. Si vous utilisez les caracteres speciaux Unicode sepa- 
rateurs de paragraphe et de ligne, d'une maniere differente que ne le fait votre editeur 
de texte, les messages d'erreur seront plus difficile a interpreter. C'est mieux d'utiliser 
les caracteres de saut de ligne classiques. 

Les symboles sont detectes d'une maniere large ; l'interpreteur Perl lit le symbole le 
plus long possible lors de la lecture du code. Si vous voulez qu'il distingue deux symbo- 
les il suffit d'inserer un espace blanc entre eux. (La tendance est d'inserer plusieurs es- 
paces pour rendre le code plus lisible.) 

Un commentaire commence par le caractere # et s'etend jusqu'a la fin de la ligne. Un 
commentaire equivaut a un espace et joue le role de separateur. Perl n'interprete pas 
une ligne placee en commentaire. 3 

Si une ligne, et c'est une autre originalite lexicale, commence par = a un endroit oil une 
instruction serait legale, Perl ignore tout de cette ligne jusqu'a la prochaine contenant 
=cut. Le texte ignore est suppose etre du POD, ou Plain Old Documentation (des program- 
mes Perl permettent de convertir ces commentaires au format des pages de manuel, ou 
en documents BTgX, HTML et bientot XML). D'une maniere complementaire, l'analy- 
seur lexical extrait le code Perl d'un module et ignore les balises pod, ce qui permet de 
conserver la documentation a l'interieur des modules. Voir le chapitre 26, POD, pour 
les details sur pod et la documentation multiligne. 

Mais seul le premier # est necesaire, les autres ne sont que de la decoration, bien que la 
plupart des codeurs Futilisent pour faire des effets visuels comme avec le langage C ou 
ils font une utilisation abondante du caractere *. 

En Perl, comme en chimie ou en linguistique, on construit des structures de plus en 
complexes a partir d'elements simples. Par exemple, une instruction est une sequence de 
symboles sur le mode imperatif. On peut combiner une serie d'instructions pour for- 
mer un bloc delimite par des accolades. Les blocs peuvent eux-memes constituer d'autres 
blocs. Certains blocs fonctionnels tels que les sous-programmes peuvent etre combines en 
modules eux-memes combines en programmes, nous verrons tout ceci dans les prochains 
chapitres. Mais creons encore des symboles avec nos caracteres. 

Types internes 

Avant de construire des types plus complexes, nous devons introduire quelques abstrac- 
tions, plus precisement trois types de donnees. 

Chaque langage dispose de ses propres types de donnees et a la difference des autres, Perl 
en possede peu ce qui reduit les confusions possibles. Prenons par exemple le langage C 
qui dispose des types suivants : char, short, int, long, long long, bool, wcharjt, sizejt, 
off_t, regex_t, uid_t, u_longlong_t, pthread_key_t, fp_exception_field_type, et 
ainsi de suite. Ce sont juste les types entiers! II y a ensuite les nombres f lottants, les poin- 
teurs et les chaines. 



3. En fait ce n'est pas exact. L'analyseur lexical de Perl regarde s'il existe un selecteur du type # ! 
(voir le chapitre 19, L'interface de la ligne de commande). II peut aussi analyser les numeros de 
ligne produits par differents prepocesseurs (voir la section Generer du Perl dans d'autres langages 
au chapitre 24, Techniques couramment employees). 
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Tous ces types compliques n'en font qu'un en Perl : le scalaire. (Les types simples de don- 
nees sont suffisants pour les besoins usuels, et il est possible de creer ses propres types en 
utilisant la programmation objet en Perl, voir le chapitre 12, Objets.) Les trois types de 
base en Perl sont : les scalaires, les tableaux de scalaires et les hachages de scalaires (connus 
aussi sous le nom de tableaux associatifs). On peut aussi les appeler structures de donnees. 

Les scalaires constituent le type fondamental a partir duquel les structures plus comple- 
xes peuvent etre construites. Un scalaire peut contenir une seule valeur simple, typique- 
ment une chaine ou un nombre. Les elements de ce type simple peuvent etre combines 
a l'interieur des deux autres types composes. Un tableau est une liste ordonnee de sca- 
laires accessibles par un indice numerique (les indices demarrent a zero). Contraire- 
ment aux autres langages, Perl traite les indices negatifs en comptant a partir de la fin 
du type indexe — aussi bien des chaines que des listes. Un hachage est un ensemble non 
ordonnede paires clef/valeur accessibles par une clef de type chaine utilisee pour acceder 
a la valeur scalaire associee. Les variables ont toujours l'un de ces trois types. (A part les 
variables, Perl comprend des bidules plus ou moins confidentiels tels que des handles 
de fichiers et de repertoires, des sous-programmes, des typeglobs, des formats et des ta- 
bles de symboles.) 

Laissons la theorie et passons a la pratique du langage pour en voir les possibilites. Nous 
allons done ecrire du code et pour cela vous presenter les termes constituant les expres- 
sions en Perl regies par des regies syntaxiques. Nous utilisons la terminologie terme 
quand nous parlerons des unites syntaxiques, un peu comme dans les equations mathe- 
matiques. 

La fonction des termes en Perl est de fournir des valeurs pour des operateurs tels l'addi- 
tion ou la multiplication. Mais a la difference d'une equation, Perl interprete l'expres- 
sion dans une action logique de la machine. Une des actions les plus courantes est la 
sauvegarde d'une valeur en memoire : 

$x = $y; 

C'est un exemple de l'operateur d'affectation (non pas l'operateur de test d'egalite des va- 
leurs numeriques, ce qui s'ecrit == en Perl). Laffectation prend la valeur de $y et la place 
dans la variable $x. Notez que le terme $x n'est pas utilise pour sa valeur mais pour sa 
fonction de memorisation. (L'ancienne valeur de $x disparait avec l'affectation.) Nous 
disons que $x est une lvalue, parce qu'elle est cible d'une affectation a gauche d'une ex- 
pression. Et nous disons que $y est une rvalue car a droite dans ce type d'expression. 

II y a un troisieme type de valeur appelee temporaire qu'il est necessaire de comprendre. 
Considerons l'expression simple suivante : 

$x = $y + l; 

Perl prend la rvalue $y et lui ajoute la rvalue 1, ce qui produit une valeur temporaire 
qui est ensuite affectee a la lvalue $x. Ces valeurs temporaires sont placees dans une 
structure interne appelee pile. 4 



4. Une pile fonctionne a la maniere de ces piles d'assiettes dans les restaurants — on peut empi- 
ler (push) ou bien depiler (pop) une assiette (le push et le pop etant deux termes bien etablis dans 
la science informatique) 



Variables 
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Les termes d'une expression empilent des valeurs, alors que ses operateurs (dont nous 
parlerons dans le prochain chapitre) depilent des valeurs et peuvent aussi empiler des 
resultats pour le prochain operateur. Dans la pile, une expression produit autant de va- 
leurs qu'elle en consomme. Nous reviendrons sur les valeurs temporaires. 

Certains termes sont exclusivement des rvalues comme 1, certains autres peuvent jouer 
les deux roles, comme la variable de l'exemple precedent nous Fa montre. C'est ce que 
nous allons voir dans la prochaine section. 

Variables 

II y existe trois types de variables correspondant aux trois types abstraits mentionnes 
plus haut. Chacun d'eux est prefixe par un caractere special. 5 Les variables scalaires sont 
toujours definies avec un caractere $ initial, meme si elles font reference a des scalaires 
a Finterieur d'un tableau ou d'un hachage. Ce caractere fonctionne un peu comme Par- 
ticle defini singulier (le ou la). Nous avons done : 



Construction 


Signification 


$jours 


Valeur scalaire simple $jours. 


$jours[28] 


29 e element du tableau @jours. 


$jours{'Fev'} 


Valeur « Fev » du hachage %jours. 



Noter que vous pouvez utiliser le meme nom pour $jours, @jours, et %jours, Perl ne 
les confondra pas. 

II existe d'autres caracteres speciaux qui s'appliquent sur les scalaires et sont utilises dans 
des cas precis. lis ressemblent a ceci : 



Construction 


Signification 


${jours} 


Identique a $jours en levant l'ambigui'te devant les caracteres 




alphanumeriques. 


$Calendrier : : jours 


Une autre variable $jours, dans le paquetage Calendrier. 


$#jours 


Dernier index du tableau @jours. 


$jours->[28] 


29 e element du tableau pointe par la reference $jours. 


$jours[0][2] 


Tableau multidimensionnel. 


$jours{2000}{ J Fev J } 


Hachage multidimensionnel. 


$jours{2000/Fev J } 


Emulation de hachage multidimensionnel. 



Les tableaux ou les tranches de tableaux (ainsi que les tranches de hachage) debutent 
par le caractere @, qui fonctionne un peu comme Particle defini pluriel (les) : 



5. Encore des termes couramment usites en informatique 
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Construction 


Signification 


(Sjours 

§jours[3,4,5] 
@jours[3. .5] 
@jours{'" jan' , 'fev'} 


equivaut a ($jours[o], $jours[l], . . . $jours[n]). 
equivaut a ($jours[3], $jours[4], $jours[5]). 
equivaut a(5>]ours[3,4,5]. 
equivaut a ($jours{' jan' }, Sjoursf'fev'}). 


Les hachages debutent par % : 


Construction 


Signification 


%jours 


@(jan => 31, fev => $bissextil e? 29: 28, . . . ) . 



Chacun de ces neuf exemples peut servir de lvalue, c'est-a-dire qu'ils specifiers une 
adresse a laquelle on peut, en autres choses, loger une valeur. Avec les tableaux, les ha- 
chages et les tranches de tableaux ou de hachages, la lvalue fournit un moyen simple 
d'affecter plusieurs valeurs d'un seul coup : 

(Sdays = 1 . . 7; 



Noms 

Nous avons parle de variables pour memoriser des valeurs mais il faut aussi memoriser 
les noms et definitions de ces variables. En theorie, cela s'appelle des espaces de nommage. 
Perl dispose de deux sortes d'espaces de nommages : la table des symboles et les portees 
lexicales. 6 II peut y avoir un nombre quelconque de tables et de portees lexicales et l'in- 
tersection des deux ensembles est nulle, pour chaque instance de Finterpreteur Perl. 
Nous detaillerons chacun de ces types tout au long de cet ouvrage. Disons simplement 
pour le moment que les tables de symboles sont des hachages a portee globale qui con- 
tiennent la table des symboles des variables globales (y compris les hachages des autres 
tables de symboles). A contrario, les portees lexicales sont des espaces anonymes non in- 
clus dans une table, mais lies a un bloc de code du programme courant. lis contiennent 
des variables accessibles uniquement dans le bloc en cours. (C'est pourquoi on utilise le 
terme portee.) Le mot lexical veut dire relatif au bloc de texte courant (ce qui n'a rien a 
voir avec ce qu'un lexicographe entend par la. Ne vous fachez pas.). 

Dans chaque espace de nommage, global ou lexical, chaque type de variable dispose de 
son propre sous-espace de nommage determine par le caractere special affecte au type. 
II est possible, sans risque de conf lit, d'utiliser le meme nom pour une variable scalaire, 
un tableau ou un hachage (ou encore, pour un handle de fichier, un nom de sous-pro- 
gramme, un label ou votre lama familier). Cela signifie que $machin et (Smachin sont 
deux variables differentes. Cela veut aussi dire que $machin[l] est un element de 
(Smachin et non une partie de $machin. Bizarre, vous avez dit bizarre ? Mais c'est normal, 
bizarrement. 



6. On les appelle plutot paquetages et pads quand il s'agit de l'implementation specifique de 
Perl, mais les expressions a rallonge sont les termes generiques utilises dans 1'industrie du logi- 
ciel, et nous les utiliserons done. Desole. 



Noms 
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Pour l'appel d'un sous-programme le caractere & est facultatif. Generalement un nom 
de sous-programme n'est pas une lvalue, quoique dans les versions recentes de Perl un 
sous-programme peut s'evaluer a une lvalue de telle sorte que Ton peut lui affecter une 
valeur en retour. 

Parfois on veut acceder aux variables d'un symbole donne, « sym » par exemple. II suffit 
d'utiliser le caractere special * ou l'asterisque indique tout type de variable (scalaire, ta- 
bleau, hachage). On les appelle typeglobs ; ils ont plusieurs fonctions. lis peuvent etre 
utilises comme lvalues. L'importation des modules se fait par l'affectation des typeglobs. 
Nous reviendrons sur ce theme plus tard. 

Perl, comme tout langage informatique, dispose d'une liste de mots reserves qu'il recon- 
nait comme termes speciaux. Cependant, les noms de variables commencant par un ca- 
ractere special, il n'y a pas de confusion possible avec les premiers. D'autres types de 
noms ne commencent pas par ces caracteres : les descripteurs de fichiers et les etiquettes. 
Avec ceux-ci attention a ne pas entrer en conf lit avec des mots reserves. Nous vous re- 
commandons pour ces types, d'utiliser des majuscules pour leurs noms. Par exemple, si 
vous ecrivez open (LOG, logfile) plutot que le regrettable open (log, "logfile"). Perl 
comprendra que vous ne parlez pas de la fonction log et des logarithmes, 7 et previent 
les futurs conflits avec les nouvelles versions de Perl. Le nom des modules utilisateurs 
commence avec une majuscule alors que les modules pragmas predefinis sont ecrits en 
minuscules. Quand nous aborderons la programmation orientee objet, vous verrez que 
les noms de classes sont en capitales pour la meme raison. 

Comme vous pouvez le deduire du precedent paragraphe, la casse est importante dans 
les identificateurs — TRUC, True, et true sont trois noms differents en Perl. Un identifi- 
cateur commence avec une lettre ou un souligne, il peut contenir des lettres et des chif- 
fres, y compris les caracteres Unicode, et peut avoir une longueur comprise entre 1 et 
251 inclus. Les ideogrammes Unicode sont des lettres mais nous vous deconseillons des 
les utiliser si vous ne savez pas les lire. Voir le chapitre 15. 

Les noms qui suivent ces caracteres speciaux ne sont pas necessairement des identifica- 
teurs. Ils peuvent commencer par un chiffre auquel cas l'identificateur ne peut contenir 
que des chiffres comme dans $123. Les noms qui commencent par tout autre caractere 
qu'une lettre, un chiffre ou souligne (comme $? ou $$), sont limites a ce caractere et sont 
predefinis en Perl. Par exemple $$ est l'ID du processus courant et $? est Findicateur 
d'etat retourne par le dernier processus fils cree. 

Dans la version 5.6 de Perl est implementee une syntaxe extensible pour les noms de 
variable interne. Toute variable de la forme ${ A AMME} est une variable speciale reservee 
par Perl. Tous ces noms speciaux sont dans la table principale de symboles. Voir le cha- 
pitre 28, Noms speciaux, pour les exemples. 

On pourrait penser que noms et identificateurs designent la meme chose, mais lors- 
qu'on parle de nom, e'est du nom absolu qu'il s'agit, e'est-a-dire celui qui indique a quelle 
table de symboles il appartient. De tels noms sont formes par une serie d'identificateurs 
separes par le symbole : : : 

$Doc: :Aide: :Perl: :Classe: :chameau 



7. On applique ici un des principes de Perl qui pretend que des choses differentes doivent etre 
representees differemment, ce qui rend le code plus lisible (a comparer avec les langages qui obli- 
gent des choses differentes a avoir la meme apparence, au detriment de la lisibilite. 
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Ce qui fonctionne comme un nom absolu de fichier : 

/Doc/Aide/Perl/Classe/chameau 

En Perl, ce chemin absolu indique les tables de symboles imbriquees, et le dernier iden- 
tificateur est le nom de la variable elle-meme, contenu dans la derniere table imbriquee. 
Par exemple, pour la variable de l'exemple precedent, la table de symbole se nomme 
Doc: :Aide: :Perl: :Classe, et le nom de la variable dans cette table est $chameau. (la 
valeur de cette variable est bien entendu « beige ».) 

Une table de symboles en Perl se nomme aussi un paquetage. Done ces variables sont 
aussi appelees variables de paquetage. Les variables de paquetage sont dites privees rela- 
tivement a leur paquetage, mais sont globales dans le sens oil les paquetages sont eux- 
memes globaux, e'est-a-dire qu'il suffit de nommer le paquetage pour y acceder, ce qui 
est difficile a faire par inadvertance. Par exemple, un programme qui reference 
$Doc : : categorie demande la variable $categorie dans le paquetage Doc : : , qui n'a rien 
a voir avec la variable $Livre : : categorie. Voir le chapitre 10, Paquetages. 

Les variables attachees a une portee lexicale ne sont pas contenues dans un paquetage, 
et ne contiennent pas la sequence : : . (Les variables a portee lexicale sont declarees avec 
my.) 

Recherche des noms 

La question est done comment Perl devine le chemin absolu d'un nom ? Comment 
trouve-t-il par exemple le nom de $categorie ? Voici les etapes successives suivies par 
l'interpreteur Perl dans la phase de lecture du code, pour resoudre les noms dans le con- 
texte courant : 

1. Premierement, Perl inspecte le bloc immediatement contenant, pour une declara- 
tion du type my (ou our) (Voir le chapitre 29, ainsi que la section Declarations avec 
portee au chapitre 4, Instructions et declarations). S'il trouve cette declaration, alors la 
variable est a portee lexicale et n'existe dans aucun — elle existe uniquement dans 
le bloc courant. Une portee lexicale est anonyme et ne peut done etre atteinte hors 
du bloc la contenant. 8 

2. S'il ne trouve pas, Perl cherche une variable a portee lexicale dans le bloc contenant 
le precedent et s'il la trouve, il la marque comme appartenant a ce bloc de niveau 
superieur. A noter que dans ce cas, sa portee comprend le bloc de la premiere etape. 
Dans le cas inverse, il repete cette deuxieme etape jusqu'a la sortie du bloc racine, le 
plus grand contenant les precedents. 

3. Quand il n'y a plus de blocs contenants, l'interpreteur examine Vunite de compila- 
tion entiere, ce qui peut etre le fichier entier ou la chaine en cours de compilation 
dans le cas de l'expression eval CHAINE. Dans ce dernier cas, la portee lexicale est la 
chaine elle-meme et non un bloc entre accolades. Si Perl ne trouve pas la variable 



8. Si la declaration our est utilisee a la place, cela revient a declarer un alias de variable de 
paquetage. Le code exterieur peut acceder a cette variable mais seulement par Fintermediaire du 
paquetage oil la variable est definie. Pour le reste une definition our fonctionne exactement 
comme une definition my. C'est utile pour limiter Fusage des globales avec la directive use 
strict (voir la directive strict au chapitre 31). Mais il est preferable d'utiliser my quand une 
variable globale n'est pas necessaire. 
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dans la portee lexicale de la chame, il considere qu'il n'y a plus de bloc et retourne a 
l'etape 2 en partant de la portee lexicale du bloc eval STRING. 

4. A ce point, Perl n'a pas encore trouve de declaration pour notre variable (ni my, ni 
our). Perl abandonne la recherche d'une variable lexicale, et suppose que la varia- 
ble recherchee est une variable de paquetage. Le degre suivant de recherche est 
done le paquetage. Si la directive strict est active, le compilateur provoque une 
erreur, (sauf si la variable est predefinie ou importee dans le paquetage courant), 
car il ne peut exister de variable globale sans qualifiant. II cherche la declaration 
package toujours dans la portee lexicale, et s'il la trouve, insere le nom du paque- 
tage trouve au debut de la variable. 

5. S'il ne trouve pas de declaration de paquetage dans la portee lexicale, Perl recher- 
che la variable dans le paquetage main qui contient tous les autres. En l'absence de 
declaration contraire, $categorie veut dire $: :categorie, qui veut dire 
$main: :categorie. (main etant un paquetage dans le paquetage de plus haut 
niveau, cela veut aussi dire $: :main: :categorie ou encore $main: :main: :catego- 
rie et $: :main: :main: :categorie et ainsi de suite. On en verra toute l'utilite dans 
Tables de symboles au chapitre 10.) 

II y a plusieurs consequences que nous devons souligner ici : 

• Le fichier etant la plus grande portee lexicale, une variable a portee lexicale ne peut 
etre vue en dehors du fichier dans lequel elle est declaree. Les portees de fichier ne 
sont pas imbriquees. 

• Tout code Perl compile appartient a au moins une portee lexicale et exactement un 
paquetage. La portee obligatoire est le fichier de code lui-meme. Les blocs conte- 
nant definissent les portees successives. Tout code Perl est compile dans un paque- 
tage exactement, et si la declaration du paquetage a une portee lexicale, le 
paquetage n'en a pas, il est global. 

• Une variable sans qualifiant peut etre cherchee dans differentes portees lexicales, 
mais dans un seul paquetage, qui est le paquetage actif (determine par la portee 
lexicale de la variable). 

• Un nom de variable ne peut avoir qu'une portee. Bien que deux portees sont acti- 
ves au meme moment (lexicale et paquetage), une variable ne peut exister que dans 
une seule a la fois. 

• Un nom de variable sans qualifiant ne peut exister que dans une place memoire, 
soit dans la premiere portee lexicale, soit dans le paquetage courant, mais pas les 
deux. 

• La recherche s'arrete des que la place memoire est trouvee, et les autres places 
memoire qui auraient ete trouvees si la recherche s'etait poursuivie, ces places 
memoire done sont neanmoins inaccessibles. 

• La place memoire d'une variable typique peut etre completement determinee a la 
compilation. 

Maintenant on sait comment le compilateur Perl resoud les noms, mais parfois on ne 
connait pas ce nom au moment de la compilation : par exemple dans le cas d'une indi- 
rection. Dans ce cas, Perl fournit un mecanisme qui permet de remplacer une variable 
par une expression qui retourne une reference a cette variable. Par exemple, au lieu de 
dire : 



50 



Chapitre 2 — Composants de Perl 



$categorie 

vous diriez : 

${ une_expression() } 

et si lafonction une_expression() retourne une reference a la variable $categorie (ou 
bien la chame " categor ie " ), cela fonctionne de la meme maniere. Par contre, si la fonc- 
tion retourne $thesaurus ce sera cette variable a la place. Cette syntaxe est la plus gene- 
rale (et la moins lisible) des formes d'indirection, mais nous verrons des variantes plus 
pratiques au chapitre 8, References. 

Valeurs scalaires 

Qu'il soit reference directement ou indirectement, dans une variable, un tableau ou 
bien une variable temporaire, un scalaire contient toujours une valeur simple qui peut 
etre un nombre, une chaine ou une reference a une autre donnee. II peut aussi n'avoir 
aucune valeur auquel cas il est dit indefini. Les scalaires sont sans type, meme s'ils peu- 
vent referencer toutes sortes de donnees : il n'est pas necessaire de les declarer. 9 

Perl memorise les chames comme des sequences de caracteres sans contrainte de lon- 
gueur ni de contenu. Nul besoin de declarer une taille a Favance et tout caractere peut 
y etre inclus, y compris le caractere nul. Les nombres sont representes sous forme d'en- 
tiers signes si possible, ou bien sous forme de nombres a virgule f lottante en double pre- 
cision dans le format natif de la machine. Les valeurs f lottantes ne sont pas infiniment 
precises, c'est pourquoi certaines comparaisons de la forme (10/3 == 1/3*10) echouent 
mysterieusement. 

Perl convertit les scalaires en differents sous-types suivant les besoins ; le numerique 
peut etre traite comme du caractere et inversement, Perl faisant Ce Qu'il Faut. Pour con- 
vertir du caractere en numerique, Perl utilise la fonction C atof(3). Pour passer du nu- 
merique a une chaine de caracteres, il fait l'equivalent de sprintf(3) avec le format 
"%. 14g" sur la plupart des machines. La conversion d'une chaine non numerique com- 
me true convertit le literal a la valeur 0 ; s'ils sont actifs, les avertissements sont affiches 
sinon rien. Voir le chapitre 5, pour des exemples permettant d'identifier le contenu 
d'un chaine. 

Alors que les chaines de caracteres et les numeriques sont interchangeables dans a peu 
pres tous les cas, les references sont d'un genre different. Elles sont fortement typees, ce 
sont des pointeurs non convertibles (transtypables) comprenant des compteurs de refe- 
rences et des invocations de destructeurs internes. lis sont utilisables pour creer des ty- 
pes de donnees complexes, incluant vos propres objets. Ceci dit, les references restent 
des scalaires, car ce qui importe n'est pas tant la compexite d'une structure que le fait de 
la considerer comme un simple scalaire. 

Par non convertibles, nous voulons dire que Ton ne peut pas, par exemple, convertir une 



9. Les versions futures de Perl permettront de declarer les trois types int, num et str, pour lever 
toute ambiguite pour Poptimiseur de code. Ces types seront utilises dans du code critique qui 
doit s'executer rapidement, et nous n'entrerons pas dans le detail maintenant. Le mecanisme de 
pseudo-hash utilise ces types optionels a la maniere d'un langage plus fortement type. Voir le 
chapitre 8 pour aller plus loin. 
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reference de tableau en une reference de hachage. Les references ne sont pas converti- 
bles en un autre type pointeur. Cependant, en utilisant une reference en numerique ou 
en caractere, on obtient une valeur numerique ou une chaine de caracteres, ce qui per- 
met de se souvenir du caractere unique d'une reference, meme si le « referencement » 
de la valeur est perdu au cours de la copie depuis la vraie reference. On peut comparer 
differentes references ou tester si elles sont definies. Mais on ne peut en faire beaucoup 
plus puisqu'il n'existe pas de moyen de convertir du numerique ou du caractere en re- 
ference. En principe, si Perl n'oblige pas a faire de l'arithmetique de pointeurs — ou car- 
rement l'interdit — , ce n'est pas un probleme. Voir le chapitre 8 pour en connaitre plus 
sur les references. 

Litteraux numeriques 

Les litteraux numeriques sont specifies par n'importe quel format courant 10 de virgule 
f lottante ou d'entier : 



•X = 


12345; 


# 


entier 


.X = 


12345.67; 


# 


virgule flottante 


.X = 


6.02E23; 


# 


notation scientifique 


.X = 


4_294_967_296; 


# 


souligne pour la lisibilite 


■X = 


0377; 


# 


octal 


.X = 


Oxffff; 


# 


hexadecimal 


,x = 


ObllOOOOOO; 


# 


binaire 



Comme Perl utilise la virgule comme separateur de liste, elle ne peut servir comme se- 
parateur des milliers pour les grands nombres. Pour ameliorer leur lisibilite, Perl per- 
met d'utiliser a la place le caractere souligne. Celui-ci ne fonctionne qu'avec des 
constantes numeriques definies dans le programme, et non pour les chaines de caracte- 
res traitees comme du numerique ou pour les donnees externes lues par ailleurs. De me- 
me, les caracteres initiaux Ox en hexadecimal et 0 en octal marchent uniquement avec les 
constantes. La conversion automatique d'une chaine en un nombre ne reconnait pas ces 
prefixes — vous devez faire une conversion explicite 11 avec la fonction oct (qui marche 
aussi pour les donnees hexadecimales a condition d'indiquer Ox ou Ob au debut). 

Chaines litterales 

Les litteraux alphanumeriques sont habituellement delimites par des apostrophes sim- 
ples ou doubles. lis fonctionnent un peu comme les quotes (les delimiteurs de protec- 
tion) sous UNIX : les apostrophes doubles permettent une interpolation des antislashs 
et des variables, les apostrophes simples non. (V et \\ permettent d'inclure un antislash 
dans une chaine entre apostrophes simples). Si vous voulez inclure tout autre sequence 



10. Courant dans la culture UNIX, n'est-ce pas. Si votre culture est differente, bienvenue dans la 
notre ! 

11. On s'imagine parfois que Perl devrait de lui-meme convertir toutes les donnees. Mais il existe 
beaucoup trop de nombres decimaux avec des zeros a gauche dans le monde pour que Perl 
puisse le faire automatiquement. Par exemple, le code postal des bureaux de O'Reilly & Associa- 
tes a Cambridge, MA, est 02140. Le facteur aurait tendance a s'enerver si votre programme 
d'adressage de courrier transformait 02140 en la valeur decimale 1120. 
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telle que \n (saut de ligne), vous devez utiliser les apostrophes doubles. (Les sequences 
antislashs sont des sequences d'echappement car elles permettent d'« echapper » tem- 
porairement a Interpretation normale des caracteres.) 

Une chaine entre apostrophes simples doit etre separee du mot precedent par un espace 
car ce caractere est valide — mais archaique — dans un identificateur. On utilise plutot 
la sequence : : plus visuelle: $main'var et $main: :var representent la meme variable, la 
deuxieme etant beaucoup plus lisible. 

Les chaines entre guillemets permettent l'interpolation de differents types de caracteres 
bien connus dans les autres langages. lis sont listes au tableau 2-1 . 



Tableau 2-1. Caracteres echappes avec antislash 



Code 


Signification 


\n 


Saut de ligne (generalement LF). 


\r 


Retour chariot (generalement CR). 


\t 


Tabulation horizontals 


\f 


Saut de page. 


\b 


Retour arriere. 


\a 


Alerte (bip). 


\e 


Caractere ESC. 


\033 


ESC en octal. 


\x7f 


DEL en hexadecimal. 


\cC 


Control-C. 


\x{263a} 


Unicode (smiley). 


\N{NAME} 


Caractere nomme. 



La notation \N{/VCW} est utilisee avec la directive use charnames decrite au chapitre 31. 
Cette notation permet d'utiliser les noms symboliques comme \N{GREEK SMALL LETTER 
SIGMA}, \N{greek:Sigma}, ou \N{sigma} — suivant la directive utilisee. Voir aussi le 
chapitre 15. 

II existe de plus des sequences d'echappement pour modifier la casse des caracteres qui 
suivent. Voir le tableau 2-2. 



Tableau 2-2. Echappements de casse 



Code 


Signification 


\u 


Force le caractere suivant en majuscule (« titlecase » en Unicode). 


\1 


Force le caractere suivant en minuscule. 


\U 


Force tous les caracteres suivants en majuscules. 


\L 


Force tous les caracteres suivants en minuscules. 


\Q 


Prefixe avec antislash tous les caracteres non alphanumeriques. 


\E 


Fin de \U, \L, ou \0. 
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II est aussi possible d'inserer le caractere de saut de ligne dans une chaine qui peut done 
s'etendre sur plus d'une ligne. Ceci peut etre utile, mais aussi dangereux si vous oubliez 
un guillemet, auquel cas l'erreur sera annoncee a la prochaine occurrence de guillemet 
qui peut se trouver beaucoup plus loin dans votre fichier source. Heureusement ceci 
provoque immediatement une erreur de syntaxe sur la meme ligne, et Perl est suffisam- 
ment fute pour vous avertir qu'il s'agit peut-etre d'une chaine qui n'est pas terminee au 
bon endroit, et de plus il vous indique la ligne oil la chaine a du commencer. 

Parallelement aux sequences d'echappement ci-dessus, les chaines entre doubles apos- 
trophes permettent une interpolation des variables scalaires et des listes de valeurs. Cela 
signifie que les valeurs de certaines variables peuvent etre directement inserees dans 
une chaine. C'est en fait une forme pratique de concatenation de chaine. 12 L'interpola- 
tion ne peut etre effectuee que pour des variables scalaires, la totalite d'un tableau (mais 
pas d'un hachage), des elements unitaires d'un tableau ou d'un hachage, ou enfin, des 
tranches (des selections multiples d'elements) de tableaux ou de hachages. En d'autres 
termes, seules les expressions commencant par $ ou @ peuvent etre interpolees, car ce 
sont les deux caracteres (avec l'antislash) que l'analyseur de chaine recherche. A l'inte- 
rieur d'une chaine, un caractere @ ne faisant pas partie de l'identifiant d'un tableau ou 
d'un hachage doit etre inclus dans une sequence d'echappement avec un antislash (@), 
sous peine d'une erreur de compilation. Bien qu'un hachage complet specifie par % ne 
puisse etre interpole dans une chaine, un element ou une selection multiples d'ele- 
ments d'un hachage peuvent l'etre car ils commencent respectivement par les caracteres 
$et@. 

Le bout de code suivant affiche " Le prix est de $100.". 

$Prix = '$100'; # non interpole 

print "Le prix est de $Prix.\n"; # interpole 

Comme dans certains shells, les accolades autour d'un identifiant permettent de le dif- 
ferencier des autres caracteres alphanumeriques : "How ${verb}able ! ". En fait un iden- 
tifiant entre accolades est forcement interprets en chaine, comme les chaines clef d'un 
hachage. Par exemple, 

$jours{ , fev'} 

peut aussi etre ecrit : 

$jours{fev} 

et les apostrophes sont censees etre automatiquement presentes. Mais toute chose plus 
complexe dans l'indice sera interpretee comme une expression. 

et vous devriez les mettre entre guillemets simples : 

$jours{'29 Fevrier'} # Ok. 

$jours{"29 Fevrier"} # Ok. "" pas besoin d'interpoler. 
$jours{ 29 Fevrier } # mauvais, provoque un erreur de lecture. 

En particulier, il est necessaire d'utiliser les simples guillemets dans les tranches de ta- 
bleau : 



12. Avec les warnings actives, Perl peut retourner une erreur sur des valeurs indefinies interpo- 
lees dans des chaines concatenes ou jointes, meme implicitement, le compilateur les creant pour 
vous. 
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gjours{'Dan , , , Fev'} # Ok. 
|5)jours{"Dan" J "Fev"} # Ok aussi. 

@jours{ Dan, Fev } # erreur si la directive use strict est active 

Exceptes les indices de tableaux interpoles ou de hachages, il n'existe pas de niveaux 
multiples d'interpolation. En particulier, contrairement aux attentes de nombreux pro- 
grammeurs shell, les apostrophes inverses ne permettent pas d'interpoler a l'interieur 
d'apostrophes doubles. De meme, les apostrophes simples ne permettent pas d'empe- 
cher 1'evaluation de variables a l'interieur d'apostrophes doubles. L'interpolation est 
tres puissante mais d'un controle strict en Perl. Elle ne se produit que dans les guille- 
mets et certaines operations que nous decrirons dans la prochaine section. 

print "\n"; # Ok, imprime un saut de ligne. 

print \n ; # MAUVAIS, pas de contexte d'interpolation. 

Choisissez vos delimiteurs 

Alors que Ton ne considere souvent les delimiteurs que comme des constantes, ils fonc- 
tionnent plus comme des operateurs avec Perl, permettant plusieurs formes d'interpo- 
lation et de correspondance de motifs. Perl fournit des delimiteurs specifiques pour ces 
fonctions, mais offre egalement le moyen de choisir un delimiteur pour chacune. Au 
tableau 2-3, on peut utiliser tout caractere autre qu'alphanumerique ou d'espace comme 
delimiteur a la place de /. (Les caracteres saut de ligne et d'espace ne sont plus admis 
dans les nouvelles versions de Perl.) 



Tableau 2-3. Constructions avec guillemets 



Habituelle 


Generique 


Signification 


Interpolation 




q// 


chaine litterale 


non 


n n 


qq// 


chaine litterale 


oui 




qx// 


execution de commande 


oui 


0 


qw// 


liste de mots 


non 


a 


mil 


recherche de motif 


oui 


sill 


sill 


substitution de motif 


oui 


y/ll 


trill 


traduction 


non 


n ii 


qr// 


expression rationnelle 


oui 



Certains, ci-dessus, sont uniquement des formes de « sucre syntaxique » ; ils evitent 
d'alourdir une chame avec trop d'antislashs, en particulier dans les expressions regulie- 
res oil slash et antislash se cotoient. 

Si vous utilisez les guillemets simples comme delimiteurs, aucune interpolation de va- 
riable ne sera faite (meme si le tableau ci-dessus indique « oui »). Si le delimiteur 
ouvrant est un crochet, une parenthese, une accolade ou le signe inferieur, le delimiteur 
fermant doit lui correspondre (les occurrences de delimiteurs doivent correspondre par 
paires). Par exemple : 

$simple = q!De dis "Tu dis, 'Elle l'a dit.'"!; 

$double = qq(0n ne peut pas avoir une "bonne" $variable?); 
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$bout_de_code = q { 
if ($condition) { 
print "Pris!"; 

} 

}; 

Le dernier exemple montre qu'il est possible d'utiliser le caractere espace entre l'opera- 
teur de protection et le delimiteur. Pour les constructions a deux elements, comme si 1 1 
et tr///, si la premiere paire de delimiteurs est une accolade, la seconde partie peut en 
utiliser un autre : on peut ecrire s<foo>(bar) ou tr(a-f ) [A-F]. Les espaces sont auto- 
rises entre les deux paires de delimiteurs, ainsi le dernier exemple peut s'ecrire : 

tr [a-z] 
[A-Z]; 

Les caracteres espace sont toutefois interdits lorsque le delimiteur est #. q#f oo# est lu 
comme 'foo', alors que q #foo# est lu comme l'operateur q suivi d'un commentaire. Le 
delimiteur sera pris sur la ligne suivante. Les commentaires peuvent etre places au mi- 
lieu d'une construction a deux elements, ce qui permet d'ecrire : 

s {foo} # Remplacer foo 
{bar}; # par bar. 

tr [a-f] # Translitteration de minuscule hexa 
[A-F]; # vers majuscule hexa 

Ou n'en mettez pas du tout 

Un mot qui n'a pas d'interpretation dans la grammaire sera traite comme s'il etait dans 
une chame protegee. Ce sont les mots simples. 13 Comme pour les handles de fichier et 
les labels, un mot simple entierement en minuscules risque d'entrer en conf lit avec un 
futur mot reserve. Si vous utilisez Foption -w, Perl vous avertira de ce risque. Par exem- 
ple : 

(Sjours = (Lun,Mar,Mer,Deu,Ven); 
print STDOUT Salut, ' ', monde, "\n"; 

stocke dans le tableau @jours les abreviations des jours de la semaine et affiche « Salut 
tout le monde » suivi d'un saut de ligne sur STDOUT. En otant le handle de fichier, Perl 
essaiera d'interpreter Salut comme un handle de fichier avec a la clef une erreur de syn- 
taxe. C'est tellement source d'erreur que certains voudront declarer hors la loi les mots 
simples. Les operateurs de protection listes ci-avant ont d'autres formes y compris l'ope- 
rateur « quote words » qw// qui opere sur une liste de mots separes par des espaces : 

@jours = qw(Lun Mar Mer Deu Ven); 
print STDOUT "Salut, tout le monde\n"; 

Vous pouvez aussi bannir les mots simples de votre code. Si on ecrit : 



13. Les noms de variables, descripteurs de fichier, labels et autres, ne sont pas consideres comme 
des mots simples car ils ont un sens qui depend du mot precedent ou suivant (ou les deux). Les 
noms predefinis comme les noms de sous-programme n'en sont pas non plus. Un mot simple le 
reste tant qu'il n'y a pas la preuve du contraire. 
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use strict 'subs'; 

alors tout mot simple qui n'est pas interprete comme un appel a un sous-programme 
produit a la place une erreur de compilation. Cette restriction dure jusqu'a la fin du 
bloc qui la contient. Un autre bloc peut Fannuler par 

no strict 'subs'; 

II faut remarquer que les identifiants dans des constructions telles que : 

"${verb}able" 
$jours{Fev} 

ne sont pas considered comme des mots simples car ils sont autorises par une regie ex- 
plicite plutot que par le fait de « ne pas avoir d'interpretation dans la grammaire ». 

Un nom simple avec : : en fin, tel que main : : ou bien Chameau : : est toujours considere 
comme un nom de paquetage. Perl transforme Chameau : : en chaine « Chameau » au mo- 
ment de la compilation, et ne sera pas rejete par la directive use strict. 

Interpolation des tableaux 

Les variables tableau sont interpolees dans une chaine entre doubles apostrophes en 
reunissant tous leurs elements avec le delimiteur specifie dans la variable $" 14 l'espace 
sera pris par defaut. Les exemples suivants sont equivalents : 

$temp = join($" J (5)ARGV); 
print $temp; 

print "@ARGV"; 

A l'interieur des motifs de recherche (qui comprend aussi une interpolation identique 
a celle des doubles guillemets) il existe une ambiguite deplaisante : /$machin[chose]/ 
est-il interprete comme /${machin}[chose]} (ou [chose] est une classe de caracteres 
pour l'expression) ou comme /${machin[chose]}/ (oil [chose] est l'indice du tableau 
@machin) ? Si @machin n'existe pas, c'est bien sur une classe de caracteres. Si @machin exis- 
te, Perl devinera [chose], presque toujours a bon escient. 15 S'il decrypte mal, ousi vous 
etes paranoiaque, des accolades permettent de forcer Interpretation correcte comme ci- 
dessus. Et mime si vous etes simplement prudent, ce n'est pas une mauvaise idee. 

Documents « ici-meme » 

Un format de separation oriente ligne est base sur la syntaxe des documents « ici- 
meme » (« here » documents) du shell 16 Apres les caracteres «, on saisit une chaine des- 
tinee a terminer la partie a delimiter, toutes les lignes suivant la ligne courante jusqu'a 



14. $LIST_SEPARATOR si vous utilisez le module English. 

15. Le « devin » est trop ennuyeux a decrire completement, mais, grosso modo, il fait une 
moyenne ponderee de ce qui ressemble a une classe de caracteres (a-z, \w, les caracteres initiaux 
A ) par rapport a tout ce qui ressemble a des expressions (les variables et les mots reserves). 

16. II est oriente ligne dans le sens oil les delimiteurs sont les lignes plutot que des caracteres. Le 
delimiteur initial est la ligne courante, et celui de la fin est une ligne contenant la chaine speci- 
fiee. 
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la chaine de terminaison etant delimitees. La chaine de terminaison peut etre un iden- 
tifiant (un mot) comme du texte delimite. Dans ce cas, le type de delimiteur utilise de- 
termine le traitement du texte, comme en delimitation standard. Un identifiant non 
delimite fonctionne comme des apostrophes doubles. II ne doit pas y avoir d'espace en- 
tre les caracteres << et l'identifiant (un espace est traite comme un identifiant nul, ce qui 
est valable mais pas recommande, et correspond avec la premiere ligne vide ; voir le pre- 
mier exemple Hourra~ ! plus loin). La chaine de terminaison doit apparaitre en tant que 
telle (sans delimiteurs et non entouree d'espaces) sur la derniere ligne. 

print <<E0F; # meme exemple que precedemment 

Le prix est $Prix. 

EOF 

print <<"E0F"; # meme exemple qu'au dessus avec des apostrophes 

# doubles explicites 

Le prix est $Prix. 
EOF 

print «'E0f; # avec des apostrophes simples 

Tout est possible (par exemple le passage d'un chameau par le chas 

d'une aiguille), c'est vrai. Mais imaginez l'etat du chameau, 

deforme en un long fil sanglant de la tete aux pieds. 

-- C.S. Lewis 

EOF 

print << x 10; # affiche la ligne suivante 10 fois 

Les chameaux debarquent! Ho u rra! Hourra! 

print <<"" x 10; # La meme chose, en mieux 
Les chameaux debarquent! Ho u rra! Hourra! 

print <<~E0C~; # execute les commandes 

echo comment vas-tu 
echo yau de poele? 
EOC 

print <<"dromadaire", <<"camelide"; # on peut les empiler 

De dis bactriane. 

dromadaire 

Elle dit lama. 

camelide 

N'oubliez quand meme pas de mettre un point virgule a la fin pour finir la phrase, car 
Perl ne sait pas que vous n'allez pas essayer de faire ceci : 

print <<ABC 

179231 

ABC 

+ 20; # affiche 179251 

Si vous voulez indenter vos documents « ici-meme » avec votre code, il faut enlever les 
espaces devant chaque ligne manuellement : 
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($quote = «' QUOTE') =~ s/ A \s+//gm; 

The Road goes ever on and on, 

down from the door where it began. 
QUOTE 

II est aussi possible d'instancier un tableau avec les lignes d'un document « ici-meme » 
comme suit : 

@sauces = «fin_lignes =~ m/(\S.*\S)/g; 

tomate normale 

tomate epicee 

chili vert 

pesto 

vin blanc 
f in_lignes 

Literal V-chaine 

Un literal qui commence avec un v suivi d'un ou plusieurs entiers separes par des points 
est traduit en chaine dont chaque atome a pour valeur ordinale chaque entier. 

$crlf = V13.10; # valeur ASCII: retour chariot, saut de ligne 

Le terme v-chaine est une contraction de « vecteur-chaine » ou « version de chaine ». II 
fournit une alternative plus coherente pour construire une chaine a partir des valeurs 
numeriques de chaque caractere. Par exemple, il est plus facile d'ecrire vl. 20.300. 4000 
plutot que : 

"\x{l}\x{l4}\x{l2c}\x{fa0}" 

pack("U*", 1, 20, 300, 4000) 

chr(l) . chr(20) . chr(300) . chr(4000) 

Si un tel litteral est compose de deux ou trois points (au moins trois entiers), le prefixe 
v peut etre omis. 

print V9786; # affiche le caractere UTF-8 SMILEY, "\x{263a}" 

print vl02.lll.lll; # affiche "foo" 

print 102. 111. Ill; # idem 

use 5. 6.0; # necessite au moins cette version de Perl 

$ipaddr = 204.148.40.9; # l'addresse IP de oreilly.com 

Les v-chaines sont pratiques pour representer les adresses IP ou les numeros de version. 
En particulier avec le codage de caracteres sur plus d'un octet qui devient courant de nos 
jours, on peut comparer les numeros de version de toute taille avec les v-chaines. 

Les numeros de version et les adresses IP ne sont pas tres lisibles sous la forme de v-chai- 
nes. Pour obtenir une chaine affichable utilisez l'option v dans un masque avec printf, 
comme par exemple dans "%vd", tel que decrit au chapitre 29. Pour en savoir plus sur 
les chaines Unicode, voir le chapitre 15, ainsi que la directive use bytes au chapitre 31 ; 
pour la comparaison des versions avec les operateurs de comparaison de chaine, voir $ A V 
au chapitre 28 ; et pour la representation des adresses IPv4, voir gethostbyaddr au cha- 
pitre 29. 
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Autres symboles litteraux 

Tout symbole prefixe par deux caracteres « souligne » et postfixe de meme est reserve 
pour un usage special par Perl. Deux mots speciaux, a savoir LINE et FILE , re- 
presented le numero de la ligne courante et le fichier a ce stade du programme. lis ne 
peuvent etre utilises que comme des mots separes ; ils ne sont pas interpoles dans les 
chaines. De la meme maniere, PACKAGE est le nom du paquetage courant de compi- 
lation. S'il n'existe pas, ce qui est le cas lorsque la directive package; est vide, 

PACKAGE vaut undef. Le symbole END , ou les caracteres Control-D ou Control- 

Z, peuvent etre utilises pour indiquer la fin logique du script courant avant la fin phy- 
sique du fichier. Tout caractere suivant est ignore par le lecteur Perl mais peut etre lu 
via le descripteur special DATA. 

DATA fonctionne de la meme facon que END , mais ouvre le handle de fichier DA- 
TA a l'interieur de l'espace de nom du paquetage courant, ce qui fait que si vous inserez 
plusieurs fichiers par require, chacun peut disposer de son handle DATA personnel et 
l'ouvrir sans conf lit avec les autres. Pour en savoir plus, voir DATA au chapitre 28. 



Contexte 

Jusqu'a present, nous avons vu un certain nombre de termes pouvant produire des va- 
leurs scalaires. Avant d'en voir davantage, nous devons aborder la notion de contexte. 



Contexte scalaire et contexte de liste 

Chaque operation 17 d'un script Perl est evaluee dans un contexte specifique, et la facon 
dont l'operation se comportera peut dependre des contraintes de ce contexte. II existe 
deux contextes majeurs : les scalaires et les listes. Par exemple, l'affectation d'une variable 
scalaire evalue la partie droite dans un contexte scalaire : 

$x = fonctionQ; # contexte scalaire 

$x[l] = fonctionQ; # contexte scalaire 

$x{"ray"} = fonctionQ; # contexte scalaire 

Mais l'affectation d'un tableau ou d'un hachage (ou d'une tranche de ceux-ci) evalue la 
partie droite dans un contexte de liste. L'affectation d'une liste de scalaire se fera aussi 
par un contexte de liste pour la partie droite. 

(Six = fonctionQ; # contexte de liste 

@x[i] = fonctionQ; # id 

@x{"ray"} = fonctionQ; # id 

%x = fonctionQ; # id 

L'affectation a une liste de scalaires fournit aussi un contexte de liste en rvalue, meme 
s'il n'y a qu'un seul element dans la liste produite : 

($x,$y,$z) = fonctionQ; # contexte de liste 
($x) = fonctionQ; # id 



17. Nous utilisons ce terme a la fois pour operateur et terme. Ces deux concepts se confondent 
Tun et Fautre lorsque Ton commence a parler de fonctions qui agissent comme des termes mais 
qui ressemblent a des operateurs unaires. 
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Ces regies sont inchangees quand la variable est declaree avec les termes my ou our, ainsi 
nous avons : 



my ($x) = fonctionQ; # id 

Vous aurez beaucoup de problemes jusqu'au jour ou vous aurez compris la difference 
entre le contexte scalaire et le contexte de liste, car certains operateurs (tel notre fonc- 
tion imaginaire fonction()), connaissent leur contexte de retour et typent leur valeur 
de retour en consequence. (Ce comportement sera toujours signale quand c'est le cas.) 
En langage informatique, on dit que les operateurs ont leur type de retour surcharge par 
le contexte d'affectation. II s'agit de la surcharge la plus simple basee sur deux types sim- 
ples, le scalaire et la liste. 

Si certains operateurs repondent suivant le contexte, c'est parce que quelque chose indi- 
que son type scalaire ou liste. L'affectation se comporte comme une fonction qui fournit 
a son operande de droite le contexte. On a besoin de savoir quel operateur fournit quel 
contexte pour ses operandes. Toutes les fonctions avec un contexte de liste, ont le terme 
LISTE dans leur description. Celles qui ne Font pas ont un scalaire. C'est en general assez 
intuitif. 18 Au besoin, on peut forcer un contexte scalaire au milieu d'un contexte de 
LISTE en utilisant la pseudo-fonction scalar. (Perl ne fournit pas le moyen de forcer un 
contexte de liste en contexte scalaire, car partout ou un contexte de liste est prevu, ceci 
est deja indique par le contexte LISTE de certaines fonctions de controle.) 

Le contexte scalaire peut ensuite etre classe en contexte de chaines, numeriques ou con- 
texte tolerant. A la difference de la distinction entre scalaire et liste que nous venons de 
faire, les operations ne savent jamais quel type de contexte scalaire elles ont en entree. 
Elles se contentent de renvoyer le type de valeur scalaire qu'elles desirent et laissent Perl 
traduire les numeriques en chaine dans un contexte de chaine, et les chaines en nom- 
bres dans un contexte numerique. Certains contextes scalaires se moquent de savoir si 
une chaine ou un numerique est retourne, ce qui fait qu'aucune conversion ne sera ef- 
fectuee. (Cela arrive, par exemple, lorsqu'on affecte une valeur a une autre variable. Cel- 
le-ci prend simplement le mime sous-type que l'ancienne valeur.) 



Le contexte booleen est un contexte scalaire particulier. II correspond a l'endroit ou une 
expression est evaluee pour savoir si elle est a vrai ou a faux. Parfois nous ecrivons Vrai 
ou Faux a la place de la definition technique utilisee par Perl : une valeur scalaire est a 
vrai si ce n'est pas une chaine nulle ou le nombre 0 (ou sa chaine equivalente : "0"). Les 
references sont toujours vraies. Une reference est toujours vraie car c'est une adresse 
physique jamais nulle. Une valeur indefinie, appelee undef, est toujours fausse car elle 
vaut, suivant le contexte, " " ou 0. (Les listes n'ont pas de valeur booleenne car elles ne 
sont jamais produites dans un contexte scalaire !) 



18. Remarquez cependant que le contexte LISTE peut se propager aux appels de sous-programmes 
ulterieurs et il n'est done pas toujours facile de savoir d'un seul coup d'oeil si une phrase va etre 
evaluee dans un contexte scalaire ou de liste. Le programme peut retrouver son contexte dans un 
sous-programme par la fonction wantarray. 



my $x 
my @x 
my %x 



fonction() ; 
fonction() ; 
fonctionQ; 



# contexte scalaire 

# contexte de liste 

# id 



Contexte booleen 



Contexte 
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Puisque le contexte booleen est un contexte tolerant, il n'entraine aucune conversion ; 
a noter que c'est un contexte scalaire, et tout operande pour lequel c'est necessaire sera 
converti en scalaire. Et pour tout operande le necessitant, le scalaire retourne dans un 
contexte scalaire est une valeur booleenne possible, ce qui signifie par exemple qu'un 
operateur retournant une liste, peut etre utilise dans un test booleen : la fonction un- 
link qui opere dans un contexte de liste, peut utiliser un argument de type array : 

unlink |5)liste_f ichiers; # detruit chaque fichier de la liste. 

Maintenant, utilisons le tableau dans une condition (done contexte booleen), alors le 
tableau retourne sa cardinality car il sait que c'est un contexte scalaire ; cette valeur est 
vraie tant qu'il reste des elements dans le tableau. Supposons alors que nous voulons 
verifier que les fichiers ont ete supprimes correctement, on ecrirait : 

while (|5)liste_f ichiers) { 

my $fichier = shift @liste_f ichiers; 

unlink $fichier or warn "Ne peut pas supprimer $fichier: $!\n"; 

} 

Ici @liste_f ichier est evaluee dans le contexte booleen induit par la boucle while, de 
telle sorte que Perl evalue le tableau pour voir si sa valeur est vraie ou fausse. Cette va- 
leur est vraie tant que la liste contient des elements et devient fausse des que le dernier 
element est enleve (par l'operateur shift). Notez que la liste n'est pas evaluee dans un 
contexte scalaire. Nous indiquons au tableau qu'il est scalaire et lui demandons ce qu'il 
vaut dans ce contexte. 

N'essayez pas d'utiliser defined @f iles pour ce faire. La fonction defined regarde si le 
scalaire est egal a undef, et un tableau n'est pas un scalaire. Un simple test booleen suffit 
dans ce cas. 

Contexte vide 

Un autre type particulier des contextes scalaires est le contexte vide. Non seulement il se 
moque de la valeur a retourner, mais en plus il ne veut meme pas de valeur de retour. 
Du point de vue du fonctionnement des fonctions, il n'est pas different des autres con- 
textes scalaires, mais par le switch -w de la ligne de commande, le compilateur Perl pre- 
vient de l'utilisation d'une expression sans effet secondaire a un endroit qui ne veut pas 
d'une valeur, comme dans une phrase qui ne renvoie pas de valeur. Par exemple, si une 
chaine est employee comme phrase : 

"Camel Lot"; 

on peut obtenir un avertissement tel que : 

Useless use of a constant in void context in monprog line 123; 

Contexte interpolatif 

Nous avons deja mentionne que les apostrophes doubles autour d'une chaine permet- 
tent une interpolation des variables et une interpretation des antislashs, mais le contex- 
te interpolatif (souvent appele « contexte double quotes ») ne s'applique pas qu'aux 
chaines entre doubles apostrophes. Les autres constructions a double quotes concernent 
l'operateur general apostrophe inverse qx//, l'operateur de recherche de motif m// et 
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l'operateur de substitution si 1 1 et l'operateur d'expression reguliere qr//. En fait, l'ope- 
rateur de substitution fait une interpolation de sa partie gauche avant de faire la recher- 
che de motif, puis a chaque motif trouve fait une interpolation de sa partie droite. 

Le contexte interpolatif n'intervient qu'entre apostrophes, ou pour des choses qui fonc- 
tionnent de la meme facon, et il n'est done peut etre pas vraiment correct de l'appeler 
contexte au meme titre que les contextes scalaires ou les contextes de liste (ou peut-etre 
bien que si). 

Valeur de liste et tableaux 

Maintenant que nous avons parle des contextes, nous pouvons parler des listes de va- 
leurs et de leur comportement dans les differents contextes. Nous avons deja vu les listes 
de litteraux, definies en separant chaque valeur par une virgule (et en encadrant la liste 
par une paire de parentheses). Comme il n'est pas genant (presque jamais) d'ajouter des 
parentheses supplementaires, la forme syntaxique d'une liste s'ecrit : 

(LISTE) 

Nous venons de voir que la forme LISTE indique un terme qui retourne une liste a son 
argument, mais une liste litterale simple est l'exception a cette regie en ce qu'elle fournit 
un contexte de liste uniquement quand la liste elle-meme est dans un contexte de liste. 
La valeur d'une liste literale dans un contexte de liste est simplement les valeurs de cha- 
que element separees par une virgule dans l'ordre specifie. Comme un terme dans une 
expression, une liste literale empile simplement des valeurs temporaires sur la pile Perl, 
elles seront utilisees ensuite par l'operateur qui attend cette liste. 

Dans un contexte scalaire, la valeur d'une liste est la valeur de son dernier element, com- 
me avec l'operateur virgule du C qui ignore toujours la valeur a gauche et renvoie celle 
de droite (en faisant reference a ce que nous disions plus haut, la partie a gauche de la 
virgule fournit un contexte vide). L'operateur virgule etant associatif a gauche, une liste 
de valeurs separees par des virgules fournit toujours le dernier element car la virgule 
oublie chaque valeur precedente. Par exemple : 

@truc = ("un", "deux", "trois"); 

affecte toute la liste de valeurs au tableau @truc, mais : 

$truc = ("un", "deux", "trois"); 

n'affecte que la valeur « trois » a la variable $truc. Comme pour le tableau 
@liste_f ichiers, l'operateur virgule sait s'il est dans un contexte scalaire ou de liste et 
adapte son comportement en consequence. 

C'est important de souligner qu'une liste est differente d'un tableau. Une variable ta- 
bleau connait aussi son contexte, et dans un contexte de liste retourne la liste de ses va- 
leurs internes comme une liste litterale. Mais dans un contexte scalaire elle retourne 
simplement sa longueur. Le code suivant affecte la valeur 3 a la variable $truc : 

@truc = ("un", "deux", "trois"); 
$truc = (Struc; 

Si vous pensiez obtenir la valeur « trois », vous avez generalise un peu vite car en fait 
Perl a detecte le contexte scalaire et n'a empile que la longueur du tableau. Aucun terme 
ou operateur n'empilera des valeurs de liste dans un contexte scalaire. II empilera une 
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valeur scalaire, qui ne sera certainement pas la derniere valeur de la liste qu'il retourne- 
rait dans un contexte de liste, valeur scalaire qui est ici la longueur du tableau. II faut 
bien comprendre cet exemple (sinon, relisez le paragraphe car c'est important). 

Retournons aux vraies LISTE, celles qui induisent un contexte de liste. Jusqu'a present 
nous avons soutenu que le contexte LISTE ne contient que des litteraux. Mais en fait, tou- 
te expression qui retourne une valeur peut etre utilisee a l'interieur d'une liste. Les va- 
leurs ainsi utilisees peuvent etre des valeurs scalaires ou des listes de valeurs. Le contexte 
LISTE fait automatiquement une interpolation des sous-listes. C'est pourquoi, lorsqu'un 
contexte LISTE est evalue, chaque element de la liste est evalue dans ce contexte et la va- 
leur de la liste resultante est interpolee dans LISTE comme si chaque element individuel 
etait un membre de LISTE. Les tableaux perdent ainsi leur identite dans LISTE. La liste : 

((SmachinjljDchosej&sousProgramme) 

contient tous les elements de @machin, suivis de tous les elements de @chose, suivis de 
tous les elements renvoyes par le sous-programme sousProgramme lorsqu'il est appele 
dans un contexte de liste. Notez que si l'un quelconque des elements est nul, son inter- 
polation ne compte pas. La liste nulle est representee par ( ). Son interpolation dans une 
liste n'a pas d'effet. Ainsi ((),(),()) est equivalent a ( ) . De meme, l'interpolation d'un 
tableau sans element donne, a ce stade, la meme chose que s'il n'avait pas ete interpole. 

Une consequence est que Ton peut mettre une virgule optionnelle a la fin de toute liste. 
Ceci facilitera ulterieurement les ajouts d'elements. 

(Snombres = ( 

1, 
2, 
3, 

); 

Le mot qw, que nous avons mentionne plus tot, permet aussi d'entrer une liste litterale. 
II construit quelque chose d'equivalent a une chame entre apostrophes eclatee sur plu- 
sieurs lignes. Par exemple : 

@machin = qw( 

pomme banane carambole 

orange goyave kumquat 
mandarine nectarine peche 
poire persimmon prune 

); 

Remarquez que ces parentheses ne sont pas ordinaires et fonctionnent comme des apos- 
trophes. On aurait pu aussi mettre des signes inferieur-superieur, des accolades ou des 
slashs (mais les parentheses c'est joli). 

Une liste de valeurs peut aussi etre indicee comme un tableau standard. Vous devez 
alors mettre la liste entre parentheses (des vraies) pour eviter toute ambiguite. Si cela 
sert souvent pour obtenir une valeur du tableau, c'est aussi une tranche de la liste et la 
forme syntaxique s'ecrit : 

(LISTE) [LISTE] 

Exemples : 

# Stat renvoie une valeur liste. 
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$modification_time = (stat($fichier))[8]j 

# ERREUR DE SYNTAXE ICI. 

$modification_time = stat($fichier) [8] ; # OUPS, PAS DE PARENTHESES 

# Trouver un chiffre hexa. 

$chiffrehexa = ('a', 'b' , >c>, 'd','e', 'V )[$chiffre-lO]; 

# Un "operateur virgule inverse", 
return (pop(@machin),pop(@machin)) [0] ; 

# Affectation de plusieurs valeurs a l'aide d'une tranche. 
($jour, $mois, $annee) = (localtime)[3,4,5]; 

Affectation de liste 

Une liste est affectee si chacun de ses elements est affecte : 
($a, $b, $c) = (l, 2, 3); 

($map{rouge}, $map{vert}, $map{bleu}) = (OxffOOOO, OxOOffOO, OxOOOOff); 

II est possible d'affecter a undef dans une liste. C'est utile pour ignorer certaines valeurs 
de retour d'une fonction : 

($dev, $ino, undef, undef, $uid, $gid) = stat($fichier); 

L'element final d'une liste peut etre un tableau ou un hachage : 

($a, $b, @reste) = split; 

my ($a, $b, %reste) = @arg_list; 

Vous pouvez mettre un tableau ou un hachage dans la liste affectee en sachant que le 
premier de ce type rencontre absorbera les valeurs restantes et les variables restantes se- 
ront initialisees a undef. Ceci peut etre utile dans une initialisation de type my ou local, 
oil on veut que les tableaux soient vides. 

II est aussi possible d'affecter une liste vide : 

() = fonction_bidon(); 

De cette facon, la fonction est appelee dans un contexte de liste, mais on laisse tomber 
les valeurs renvoyees. Si vous aviez fait l'appel sans affectation, la fonction aurait ete eva- 
luee dans un contexte vide, qui est un contexte scalaire, et se serait comportee comple- 
tement differemment. 

L'affectation de liste dans un contexte scalaire retourne le nombre d'elements que four- 
nit la partie droite de l'affectation : 

$x = ( ($machin,$truc) = (7,7,7) );# $x contient 3, pas 2 
$x = ( ($machin,$truc) = f() ); # $x contient le nombre d'elements de f() 
$x = ( () = f() ); # idem 

C'est pratique lorsqu'on veut faire l'affectation d'une liste dans un contexte booleen, car 
la plupart des fonctions liste retourne une liste nulle lorsqu'elle se termine, valeur qui 
affectee a un scalaire produit la valeur 0 qui vaut faux dans ce contexte. Voici un exem- 
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pie d'utilisation dans une boucle while : 

while (($login, $password) = getpwent) { 

if (crypt($login, $password) eq $password) { 

print "$login a un mot de passe non securise!\n"; 

} 

} 

Longueur d'un tableau 

Le nombre d'elements du tableau @jours est donne par 1'evaluation de @jours dans un 
contexte scalaire : 

@jours +0; # force implicitement @jours dans un contexte scalaire 
scalar(@jours) # force explicitement (Sjours dans un contexte scalaire 

Attention, cela ne fonctionne que pour les tableaux. Cela ne fonctionne pas pour les lis- 
tes de valeurs en general. Une liste avec des virgules comme separateur evaluee dans un 
contexte scalaire retournera la derniere valeur, comme l'operateur virgule en C. Mais 
puisqu'il n'est presque jamais necessaire de connaitre la longueur d'une liste en Perl ce 
n'est pas un probleme. 

$#jours est tres proche de revaluation scalaire de @jours. Cette derniere renvoie l'indi- 
ce du dernier element du tableau, ou un de moins que la longueur puisqu'il existe (ha- 
bituellement) un element d'indice zero. L'affectation de $# jours change la longueur du 
tableau. Raccourcir un tableau de la sorte detruit les valeurs intermediaires. Vous pou- 
vez etre plus efficace en surdimensionnant a l'avance un tableau destine a s'agrandir 
(pour agrandir un tableau, on peut lui affecter un element au-dela de sa fin). Un tableau 
peut etre tronque par l'afFectation de la liste nulle (). Les deux instructions suivantes 
sont equivalentes : 

@nimportequoi = (); 
$#nimportequoi = -1; 

Et celle qui suit est toujours vraie : 

scalar(@nimportequoi) == $#nimportequoi + l; 

La troncation d'un tableau ne recupere pas la memoire ainsi liberee. II faut faire un un- 
def (@nimportequoi) pour recuperer sa memoire dans le processus courant. Vous ne 
pouvez vraisemblablement pas la retouner au systeme d'exploitation car peu de syste- 
mes en sont capables. 

Hachages 

Comme nous l'avons deja dit, un hachage n'est qu'un type special de tableau dans lequel 
on retrouve les valeurs par une chame-clef au lieu d'un indice numerique. En fait, on 
definit des associations entre les clefs et les valeurs, et c'est pourquoi les hachages sont 
souvent appeles tableaux associatifs par les personnes assez courageuses pour taper sur 
un clavier. 

II n'existe pas vraiment de syntaxe particuliere aux hachages en Perl, mais si une liste 
ordinaire est affectee a un hachage, chaque paire de valeur de la liste sera prise comme 
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une association clef/valeur. 

%map = ('rouge', OxffOOO, 'vert', OxOOffOO, 'bleu', OxOOOOff); 

Ce qui a le meme efFet que : 

%map = (); # d'abord initialiser le hachage 

$map{rouge} = OxffOOOO; 

$map{vert} = OxOOffOO; 

$map{bleu} = OxOOOOff; 

II est souvent plus lisible d'utiliser l'operateur => entre la clef et sa valeur. L'operateur => 
est synonyme de la virgule, mais il est plus clair visuellement et permet aussi une sepa- 
ration d' identifiant a gauche (comme les identifiants entre accolades ci-dessus) ; l'ini- 
tialisation des variables hachages devient plus simple : 

%map = ( 

rouge => OxffOOOO j 
vert => OxOOfffO, 
bleu => OxOOOOff, 

); 

ou pour initialiser des references banalisees de hachage utilisees comme des 
enregistrements : 

$rec = { 

NOM => 'John Smith' 

GRADE => 'Captain' 
MATRICULE => '951413', 

}; 

ou pour utiliser des appels complexes de fonctions par un nom : 

$field = $query->radio_group( 

NOM => 'group_name' , 

VALEURS => ['eenie','meenie','minie'], 

DEFAUT => 'meenie', 

SAUTDELIGNE => 'true', 

LABELS => %labels, 

)J 

Mais n'allons pas trop vite. Revenons a nos hachages. 

Une variable hachage (%hachage) peut etre utilisee dans un contexte de liste, toutes ses 
paires clef/valeurs etant interpolees dans la liste. Mais ce n'est pas parce que le hachage 
a ete initialise dans un certain ordre que les valeurs sont retournees dans le meme. Les 
hachages sont implementes au niveau interne en utilisant des tables de hachage pour 
une recherche rapide, ce qui signifie que Fordre dans lequel les donnees sont stockees 
depend du type de fonction de hachage utilisee pour determiner la place de la paire 
clef/valeur. Ainsi, les entrees sont apparemment retournees dans un ordre quelconque 
(au niveau d'une paire clef/valeur, les deux elements sont bien sur rendus dans le bon 
ordre). Pour des exemples de reordonnancement en sortie, voir la fonction keys au cha- 
pitre 29. 

Si un hachage est evalue dans un contexte scalaire, une valeur vraie est renvoyee si et seu- 
lement si le hachage contient des paires clefs/valeurs. (S'il existe plusieurs paires, la valeur 
renvoyee est une chaine contenant le nombre de cellules utilisees (buckets) et le nombre 
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de cellules allouees, separes par un slash. Ceci n'est utile que pour savoir si l'algorithme 
resident de Perl traite correctement ou non l'ensemble de donnees. Par exemple, on en- 
tre 10 000 elements dans un hachage, mais revaluation de %HASH dans un contexte scalai- 
re revele « 1/8 », cela signifie que seulement une des 8 cellules a ete touchee, et qu'elle 
contient probablement les 10 000 elements. Ce n'est pas cense se produire. 

Pour trouver le nombre de clefs dans un hachage, utilisez la fonction keys dans un con- 
texte scalaire : scalar(keys(%HASH)). 

II est possible d'emuler un tableau multidimensionnel en specifiant plus d'une clef 
dans les accolades separees par une virgule. Les clefs listees sont concatenees ensemble 
separees par le caractere $; ($SUBSCRIPT_SEPARAT0R) qui a la valeur chr (28) par defaut. 
La clef resultante devient une clef du hachage. Ces deux lignes font la meme chose : 

$habitants{ $pays, $departement } = $resultat_recensement; 
$habitants{ join $; =>; $pays, $departement } = $resultat_recensement; 

Cette fonctionalite fut a l'origine implemented pour le traducteur a2p (awk vers perl). 
Aujourd'hui, vous utiliseriez plus justement un tableau multidimensionnel comme il 
est decrit au chapitre 9, Structures de donnees. Un usage encore pratique de cet ancien sty- 
le est la liaison des hachages aux fichiers DBM (voir DB_File au chapitre 32, Modules 
standards), qui n'implementent pas les clefs multidimensionnelles. 

Ne confondez pas l'emulation multidimensionnelle des hachages avec les tranches de 
tableaux. L'un est une valeur scalaire, l'autre represente une liste : 

$hachage{ $x, $y, $z } # une valeur simple 

@hachage{ $x, $y, $z } # une tranche de trois valeurs 

Typeglobs et handles de fichiers 

Perl utilise un type special appele typeglob qui contient la table des types Perl pour ce 
symbole. (La table des symboles *f oo contient les valeurs de $foo, @foo, %foo, &f oo et 
d'autres interpretations de f oo.) Le prefixe de typage d'un typeglob est * car il represente 
tous les types. 

Les typeglobs (ou leur references) sont toujours utilises pour passer ou stocker des han- 
dles de fichier. Pour sauvegarder un handle de fichier il faut taper : 

$fh = *STD0UT; 

ou comme une vraie reference, de cette maniere : 

$fh = \*STD0UT; 

C'est aussi le moyen de creer un handle de fichier local. Par exemple : 

sub newopen { 

my $path = shift; 

local *FH; # et non my ou our! 

open (FHj $path) | | return undef; 
return *FH; # et non \*FH! 

} 

$fh = newopenC/etc/passwd'); 
Voir la fonction open pour generer d'autres handles de fichiers. 
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Cependant, la principale utilisation des typeglobs est actuellement de servir d'alias en- 
tre deux entrees symboliques. C'est comme un surnom. Si on ecrit 

*machin = $truc; 

tout ce qui s'appelle « machin », est synonyme de tout ce qui s'appelle « true ». L'alias 
peut porter sur un seul type des variables du nom en affectant une reference : 

*machin = $truc; 

$machin devient alias de $truc, mais@machin n'est pas synonyme de @truc, ni %machin 
de %truc. Tout ceci ne concerne que les variables globales, e'est-a-dire definies dans un 
paquetage ; les variables lexicales ne peuvent etre accedees a travers la table des symbo- 
les. Le mecanisme d'import/export est entierement base sur ce principe, l'alias ne pre- 
suppose en effet aucune appartenance a un module specifique. Cette instruction : 

local *Ici::bleu = \$Ailleurs: :vert; 

fait de $Ici: :bleu un alias pour $Ailleurs: :vert, mais ne fait pas de @Ici: :bleu un 
alias pour @Ailleurs: :vert, ni %Ici: :bleu un alias pour %Ailleurs; : :vert. Heureu- 
sement, toutes ces manipulations compliquees de typeglobs sont transparentes la plu- 
part du temps. Voir le chapitre 8, et Tables de symboles au chapitre 10 et le chapitre 11, 
Modules, pour un developpement sur ces sujets. 

Operateurs d'entree 

Nous allons maintenant presenter plusieurs operateurs d'entree qui sont analyses com- 
me des termes. En fait, on les appelle parfois des pseudo-litteraux car ils agissent, dans 
bien des cas, comme des chaines protegees (les operateurs de sortie comme print fonc- 
tionnent comme des operateurs de liste et sont traites au chapitre 29.) 

Operateur d'execution de commande (Backtick) 

Premierement il y a l'operateur de ligne de commande, aussi appelle operateur backtick, 
et qui ressemble a ceci : 

$info = "finger $user~; 

Une chaine protegee par des apostrophes inverses precede tout d'abord a une interpo- 
lation des variables comme dans une chaine entre apostrophes doubles. Le resultat est 
alors interprete comme une commande par le shell, et la sortie de la commande devient 
la valeur de l'identifiant (ceci fonctionne comme certains operateurs similaires des shells 
UNIX). Dans un contexte scalaire, le resultat est une chaine simple contenant toutes les 
sorties de la commande. Dans un contexte de liste, une liste de valeurs est renvoyee, une 
pour chaque ligne sortie par la commande. (On peut utiliser $/ pour avoir un autre ca- 
ractere de terminaison de ligne.) 

La commande est interpretee chaque fois que l'identifiant est evalue. La valeur nume- 
rique du statut de la commande est stockee dans $? (voir le chapitre 28 pour l'interpre- 
tation de $?, connu aussi sous le nom de $CHILD_ERR0R). A la difference de csh, aucune 
transformation n'est faite sur les donnees renvoyees ; les sauts de ligne restent des sauts 
de ligne. A l'inverse de tous les shells, les apostrophes simples n'empechent pas l'inter- 
pretation des noms de variables. Pour passer un $ au shell il faut le cacher par un anti- 
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slash. Le $user de notre exemple ci-dessus est interpole par Perl, mais non par le shell 
(la commande lancant un processus shell, consultez le chapitre 23, Securite, pour les pro- 
blemes de securite). 

La forme generalisee pour les apostrophes inverses est qx// (pour quoted execution, exe- 
cution protegee), mais l'operateur fonctionne exactement de la meme facon que les 
apostrophes inverses ordinaires. II suffit de choisir ses caracteres de protection. Comme 
avec les pseudo-fonctions de protection, si vous choisissez un simple guillemet comme 
delimiteur, la chame de commande n'est pas interpolee : 

$perl_info = qx(ps $$); # Variable $$ de Perl 

$shell_info = qx'ps $$'; # Variable $$ du shell 

Operateur de lecture de ligne (Angle) 

L'operateur de lecture de ligne est l'operateur le plus utilise, aussi connu sous le nom 
d'operateur inferieur-superieur, ou fonction readline. L'evaluation d'un handle de fi- 
chier entre inferieur-superieur (par exemple <STDIN>) donne la ligne suivante du fichier 
associe. Le saut de ligne est inclus, done en accord avec les criteres de veracite de Perl, 
chaque ligne lue a une valeur vrai, et lorsque le programme atteint la fin du fichier, 
l'operateur angle retourne undef, e'est-a-dire faux. On affecte d'habitude la valeur lue a 
une variable, mais il existe un cas ou une affectation automatique se produit. Si, et seu- 
lement si, l'operateur de lecture de ligne est la seule chose presente dans le test de boucle 
d'un while, la valeur est automatiquement affectee a la variable speciale $_. La valeur 
affectee est alors testee pour savoir si elle est definie (cela peut vous paraitre idiot, mais 
vous utiliserez cette construction dans presque tous vos scripts Perl). Bref, les lignes sui- 
vantes sont toutes equivalentes : 

while (defined($_ = <STDIN>)) { print $_; } # methode longue 

while ($_ = <STDIN>) { print; } # utilise $_ explicitement 

while (<STDIN>) { print; } # methode courte 

for (;<STDIN>;) { print; } # boucle while deguisee 

print $_ while defined($_ = <STDIN>); # instruction modifiee longue 

print while $_ = <STDIN>; # utilise $_ 

print while <STDIN>; # instruction modifiee courte 

Souvenez-vous que cette astuce requiert une boucle while. Si vous utilisez l'operateur 
ailleurs, vous devez affecter le resultat explicitement pour garder la valeur. 

while (<FH1> && <FH2>) {...} # mauvais : perd les deux entrees 

if (<STDIN>) { print; } # mauvais, affiche l'ancienne 

# valeur de $_ 

if ($_ = <STDIN>) { print; } # ne teste pas si $_ est defini 

if (defined($_ = <STDIN>)) { print; } # meilleur 

Quand la variable $_ est implicitement affectee dans une boucle, e'est la variable globa- 
le dont il s'agit. Vous pouvez proteger la valeur de $_ de la maniere suivante : 

while (local $_ = <STDIN>) { print; } # utilise local $_ 

L'ancienne valeur est retablie a la sortie de la boucle. $_ peut toujours etre accedee depuis 
la boucle. Pour eviter toute confusion, il est preferable d'utiliser une variable lexicale : 

while (my $ligne = <STDIN>) { print $ligne; } # variable privee 
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(Ces deux boucles while testent si l'affectation est defined, car my et local ne changent 
pas son comportement habituel.) Les handles de fichiers STDIN, STDOUT et STDERR sont 
predefinis et ouverts. D'autres handles peuvent etre crees avec les fonctions open ou 
sysopen. Voir la documentation de ces fonctions au chapitre 29 pour les details. 

Dans la boucle while ci-dessus, la ligne d'entree est evaluee dans un contexte scalaire, 
chaque valeur est retournee separement. Si on l'utilise dans un contexte de liste, une 
liste de toutes les lignes d'entree restantes est retournee, chaque ligne etant un element 
de liste. Un important espace de donnees peut ainsi etre cree, et il faut done l'utiliser avec 
precaution : 

$une_ligne = <MYFILE>; # Donne la premiere ligne. 
@toutes_lignes = <MYFILE>; # Donne le reste des lignes. 

II n'existe pas de magie particuliere pour le while associe a la forme liste de Foperateur 
d'entree, car la condition d'une boucle while est toujours un contexte scalaire (comme 
toutes les conditions). 

L'utilisation du handle de fichier nul a Finterieur de Foperateur inferieur-superieur (ou 
operateur angle) est particuliere et peut etre utilisee pour emuler la ligne de commande 
de programmes standards d'UNIX tels que sed et aivk. Quand on lit les lignes depuis <>, 
toutes les lignes de tous les fichiers mentionnes sur la ligne de commande sont ren- 
voyees. Si aucun fichier n'etait specifie, e'est l'entree standard qui est renvoyee a la place 
et le programme peut ainsi etre facilement insere entre des processus pour former un 
pipe. 

Voici comment cela fonctionne : la premiere fois que <> est evalue, le tableau @ARGV est 
controle, et s'il est nul, $ARCV[o] est mis a « - », qui donne l'entree standard quand on 
l'ouvre. Le tableau @ARGV est traite comme une liste de noms de fichiers. La boucle 

while (<>) { 

# code pour chacune des lignes 

} 

est equivalente au pseudo-code Perl suivant : 

while (@ARGV and $ARGV[0] =~ / A -/) { 
$_=shift; 
last if / A --$/; 

if (/ A -D(.*)/) { $debug = $1 } 
if (/ A -V/) { $verbose++ } 

# autres alternatives 

} 

while (<>) { 

# du code dans chaque ligne 

} 

a part une meilleure lisibilite, le resultat reste identique. Le tableau @ARGV est decale et 
le nom du fichier courant est stocke dans la variable $ARGV. Le handle de fichier ARGV est 
aussi utilise en interne ; <> est simplement un synonyme de <ARGV>, qui est magique (le 
pseudo-code ci-dessus ne fonctionne pas parce qu'il traite <ARGV> comme non-magique). 

Il est possible de modifier @ARGV avant l'instruction <> du moment que le tableau est 
construit avec les noms de fichier que vous attendez. Le nom de fichier « - » qui repre- 
sente l'entree standard, peut etre ouvert avec la fonction open, ainsi que des flux plus 
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esoteriques comme « gzip -de < file.gz | »). Les numeros de ligne ($.) s'incremen- 
tent comme s'il n'existe qu'un fichier en entree. (Mais observez l'exemple ci-dessous sur 
eof pour voir comment on reinitialise les numeros de ligne a chaque fichier.) 

Pour affecter @ARCV a une liste de fichiers, e'est direct : 

# par defaut: le fichier README si aucun argument n'est donne 
@ARGV = ("README") unless @ARGV; 

Pour passer des options dans un script, on peut utiliser un des modules Getopt ou met- 
tre une boucle initiale telle que : 

while ($_ = $ARGV[0], / A -/) { 
shift; 

last if / A --$/; 

if (/ A -D(.*)/) { $debug = $1 } 
if (/ A -v/) { $verbose++ } 

# autres options 

} 

while (<>) { 

# code pour chacune des lignes 

} 

Le symbole <> ne renvoie faux qu'une seule fois. En cas d'appel ulterieur, une autre liste 
@ARGV est supposee etre traitee, et si @ARGV n'est pas initialise les lectures se font depuis 
STDIN. 

Si la chaine entre l'operateur angle est une variable (par exemple, <$machin>), alors cel- 
le-ci contient le nom du fichier a lire ou une reference a celui-ci. Par exemple : 

$fh = \*STDIN; 
$ligne = <$fh>; 

ou : 

open($fhj "<donnees.txt>"); 
$line = "<$fh>"; 

Operateur de globalisation des noms de fichier 

Vous vous souciez peut-etre de ce qui peut arriver a un operateur de lecture de ligne si 
vous mettez quelque chose de bizarre entre l'inferieur et le superieur. II est alors trans- 
forme en un operateur different. Si la chaine a l'interieur de l'operateur angle est diffe- 
rente du nom d'un handle de fichier ou d'une variable scalaire (mime s'il agit d'espace), 
elle sera interpreted comme etant un motif de fichier a « globaliser ». 19 Le motif de re- 
cherche s'applique aux fichiers du repertoire courant (ou dans le repertoire specifie 
dans le motif glob lui-meme), et les fichiers correspondants sont retournes par l'opera- 
teur. Comme pour les lectures de ligne, les noms sont renvoyes un a un dans un contex- 



19. Cela n'a rien a voir avec les typeglobs deja cites, si ce n'est qu'ils utilisent tous deux le carac- 
tere * a la facon d'un joker. Le caractere * prend le surnom « glob » lorsqu'il est utilise de cette 
maniere. Avec les typeglobs, on globalise les symboles homonymes d'une table de symboles. Avec 
un glob de nom de fichier (global), on effectue une correspondance par des jokers des fichiers 
d'un repertoire, comme le font de nombreux shells. 
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te scalaire, ou tous a la fois dans un contexte de liste. Ce dernier usage est en fait 
predominant. II est courant de voir : 

my @fichiers = <*.xml>; 

Comme pour d'autre types de pseudo-constantes, un premier niveau d'interpolation est 
effectue, mais on ne peut pas ecrire <$machin> car il s'agit d'un handle de fichier indi- 
rect, comme nous Favons deja vu. Dans d'anciennes versions de Perl, les programmeurs 
inseraient des accolades pour forcer une interpretation de nom de fichier glob : 
<${machin}>. De nos jours, on considere qu'il est plus propre d'appeler la fonction in- 
terne directement par glob($machin), ce qui aurait du etre le cas des l'origine. On ecri- 
rait done : 

(ffifichiers = glob("*.xmi"); 

si vous preferez. 

Que Ton utilise la fonction glob ou sa forme ancienne avec l'operateur d'angle, Fopera- 
teur de globalisation fonctionne de la meme facon dans une boucle que l'operateur 
while en affectant le resultat a $_. (Ce fut la premiere raison de surcharger cet opera- 
teur.) Par exemple, si vous vouliez changer les autorisations de fichiers de code C, vous 
ecririez : 

while (glob "*.c") { 
chmod 0644, $_; 

} 

ce qui est equivalent a : 

while (<*.c>) { 
chmod 0644, $_; 

} 

La fonction glob etait implementee comme une commande shell dans les anciennes 
versions de Perl (aussi dans les anciennes versions d'Unix), etait plus couteuse en res- 
sources et ne fonctionnait pas de la meme facon sur tous les systemes. C'est aujourd'hui 
une fonction predefinie plus fiable et plus rapide. Voyez la description du module 
File: :Clob au chapitre 32 pour modifier son comportement par defaut pour, par 
exemple, traiter les espaces dans ces arguments, l'expansion de certains caracteres (tilde 
ou accolade), Finsensiblite a la casse ou bien le classement des valeurs retournees, entre 
autres choses. 

Bien stir, la facon la plus courte et la moins lisible pour faire la commande chmod ci-des- 
sus, est d'utiliser la globalisation comme un operateur sur liste : 

chmod 0644, <*.c>; 

Un glob n'evalue son argument que quand il demarre une nouvelle liste. Toutes les va- 
leurs doivent etre lues avant son execution. Dans un contexte de liste, ce n'est pas tres 
important, puisqu'on les a toutes automatiquement. Mais dans un contexte scalaire, 
l'operateur renvoie la prochaine valeur a chaque appel, ou une valeur fausse si on arrive 
au bout. Attention, faux n'est retourne qu'une seule fois. Ainsi, si l'on attend une valeur 
unique pour un glob, il vaut mieux ecrire : 

($fichier) = <blurch*>; # contexte de liste 

au lieu de : 



$fichier = <blurch*>; # contexte scalaire 
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car la premiere forme avale tous les noms de fichier correspondants et reinitialise Fope- 
rateur, alors que ce que renvoie la seconde alterne entre un nom de fichier et faux. 

Pour interpoler des variables, il faut absolument utiliser l'operateur glob, car Fancienne 
syntaxe peut etre confondue avec la notation indirecte des handles de fichiers. Mais a ce 
niveau, il devient evident que la frontiere entre les termes et les operateurs est un peu 
floue. 

(Sfiles = <$dir/*. [ch]>; # a eviter 

@f iles = glob("$dir/*. [ch]"); # appelle glob en tant que fonction 
@files = glob $un_motif; # appelle glob en tant qu'operateur 

Nous ne mettons pas les parentheses dans le second exemple pour montrer que glob 
peut etre utilise comme un operateur unaire, c'est-a-dire un operateur prefixe avec un 
seul argument. L'operateur glob est un exemple A'operateur unaire defini, qui n'est qu'un 
des types d'operateurs dont nous parlerons dans le prochain chapitre. Ensuite nous par- 
lerons des operations de recherche de motif, qui ressemblent elles aussi a des termes, 
mais fonctionnent comme des operateurs. 



3 

Operateurs unaires et 

binaires 



Dans le chapitre precedent, nous avons parle des differents types de termes que vous 
pouvez utiliser dans une expression. Mais pour etre honnete, les termes isoles sont un 
peu ennuyeux. Beaucoup de termes sont de joyeux retards ; ils aiment comuniquer les 
uns avec les autres. Un terme typique ressent une forte envie de s'identifier avec d'autres 
termes, ou de les inf luencer de differentes manieres. Cependant, il existe de nombreuses 
sortes d'interactions sociales et de nombreux niveaux d'implication. En Perl, ces rela- 
tions sont exprimees a l'aide d'operateurs. 

II faut bien que la sociologie serve a quelque chose. 

D'un point de vue mathematique, les operateurs sont des fonctions ordinaires avec une 
syntaxe speciale. D'un point de vue linguistique, les operateurs sont juste des verbes du 
troisieme groupe. Mais comme tout linguiste vous le dira, les verbes du troisieme grou- 
pe sont generalement ceux que Ton utilise le plus souvent. C'est important du point de 
vue de la theorie de l'information, car les verbes du troisieme groupe sont generalement 
plus courts et plus efficaces tant pour la production que pour la reconnaissance. 

D'un point de vue pratique, les operateurs sont maniables. 

On distingue plusieurs varietes d'operateurs, en fonction de leur ante' (le nombre d'ope- 
randes qu'ils prennent), leur precedence (leur capacite a prendre leurs operandes aux 
operateurs voisins), et leur associativite (agissent-ils de gauche a droite ou de droite a 
gauche quand ils sont associes a des operateurs de meme precedence). 

Les operateurs Perl se presentent sous trois arites : unaire, binaire ou temaire. Les opera- 
teurs unaires sont toujours des operateurs prefixes (exceptes les operateurs de post-in- 
crementation et de post-decrementation). 1 Tous les autres sont des operateurs infixes — 
a moins que vous ne comptiez les operateurs de liste, qui peuvent preceder autant d'ar- 
guments que vous voulez. Cependant la plupart des gens preferent voir les operateurs 
de liste comme des fonctions normales autour desquelles on peut oublier de mettre des 
parentheses. Voici quelques exemples : 



1. Bien que Ton puisse egalement voir les differents types de guillemets et de parentheses (cro- 
chets, accolades) comme des operateurs « circonfixes » qui englobent et delimitent des termes. 
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! $x # un operateur unaire 

$x * $y # un operateur binaire 

$x ? $y : $z # un operateur ternaire 

print $x, $y, $z # un operateur de liste 



La precedence d'un operateur determine sa force d'attraction. Les operateurs de plus 
haute precedence capturent les arguments qui les entourent avant les operateurs de 
moindre precedence. L'exemple typique sort tout droit des mathematiques elementai- 
res, oil la multiplication est prioritaire sur l'addition : 

2+3*4 # vaut 14, et non 20 

L'ordre dans lequel sont executes deux operateurs de mime precedence depend de leur 
associativite. Les regies suivent en partie les conventions des mathematiques : 

2*3*4 # signifie (2 * 3) * 4, associatif a gauche 

2 ** j ** ^ # signifie 2 ** (3 ** 4), associatif a droite 

2 != 3 != 4 # illegal, car non associatif 

Le tableau 3-1 liste l'associativite et Farite des operateurs Perl par ordre de precedence 
decroissante. 



Tableau 3-1. Precedence des operateurs 



Associativite 


Arite 


Classe de precedence 


Non associatifs 


0 


Termes et operateurs de liste (vers la gauche) 


Gauche 


2 


-> 


Non associatifs 


1 


++ -- 


Droite 


2 


** 


Droite 


1 


! ~ \+ unaire et - unaire 


Gauche 


2 


= ~ j~ 


Gauche 


2 


* / % X 


Gauche 


2 


+ - . 


Gauche 


2 


« >> 


Droite 


0,1 


Operateurs unaires nommes 


Non associatifs 


2 


<><=>= It gt le ge 


Non associatifs 


2 


== != <=> eq ne cmp 


Gauche 


2 


& 


Gauche 


2 


1 A 


Gauche 


2 


&& 


Gauche 


2 


II 


Non associatifs 


2 




Droite 


3 


?: 


Droite 


2 


= += -= *=et suivants 


Gauche 


2 


, => 


Droite 


0+ 


Operateurs de liste (vers la droite) 


Droite 


1 


not 
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Tableau 3-1. Precedence des operateurs (suite) 



Associativite 


Arite 


Classe de precedence 


Gauche 


2 


and 


Gauche 


2 


or xor 



Vous pourriez penser qu'il y a bien trop de niveaux de precedence a se souvenir. Et bien 
vous avez raison. Heureusement, deux choses jouent en votre faveur. D'abord les ni- 
veaux de precedence tels qu'ils sont definis sont en general assez intuitifs, en supposant 
que vous n'etes pas psychotique. Ensuite, si vous etes seulement nevrose, vous pouvez 
toujours ajouter des parentheses supplementaires pour calmer votre angoisse. 

Notez egalement que tous les operateurs empruntes a C conservent les mimes relations 
de precedence entre eux, meme quand les regies de precedence de C sont legerement 
biscornues. (Cela rend Perl d'autant plus facile a apprendre pour les personnes qui con- 
naissent C ou C++. Peut-etre meme pour celles qui connaissent Java.) 

Les sections qui suivent couvrent ces operateurs dans leur ordre de precedence. A de tres 
rares exceptions, ils operent tous uniquement sur des valeurs scalaires et non sur des lis- 
tes. Nous indiquerons les exceptions quand elles se presenteront. 

Bien que les references soient des valeurs scalaires, utiliser la plupart de ces operateurs 
sur des references n'a pas beaucoup de sens, car la valeur numerique d'une reference n'a 
de signification que dans les profondeurs de Perl. Neanmoins, si une reference pointe 
sur un objet d'une classe qui autorise la surcharge d'operateurs, vous pouvez utiliser ces 
operateurs sur cet objet ; si la classe a defini une surcharge pour tel ou tel operateur, cela 
decrit comment l'objet sera traite par cet operateur. C'est ainsi par exemple que les nom- 
bres complexes sont implementes en Perl. Pour plus d'informations sur la surcharge 
d'operateurs, voir le chapitre 13, Surcharge. 

Termes et operateurs de listes (vers la gauche) 

En Perl, tout terme est de precedence maximale. Les termes comprennent les variables, 
les apostrophes et les operateurs de type quote, la plupart des expressions entre paren- 
theses, crochets ou accolades, et toute fonction dont les arguments sont entre parenthe- 
ses. En fait, si on regarde les choses ainsi, il n'y a pas vraiment de fonctions, mais 
seulement des operateurs de liste et des operateurs unaires qui se comportent comme 
des fonctions parce que vous avez mis des parentheses autour de leurs arguments. Tout 
cela n'empeche pas le chapitre 29 de s'appeler Fonctions. 

Maintenant lisez attentivement. Voici quelques regies tres importantes qui simplifient 
grandement les choses, mais qui peuvent a l'occasion produire des resultats contraires a 
l'intuition pour les imprudents. Si un operateur de liste (comme print) ou un opera- 
teur unaire nomme (comme chdir) est suivi d'une parenthese ouvrante comme token 
suivant (sans tenir compte des blancs), l'operateur et ses arguments entre parentheses 
ont la precedence la plus haute, comme s'il s'agissait d'un appel de fonction normal. La 
regie est la suivante : si cela ressemble a un appel de fonction, alors c'est un appel de fonc- 
tion. Vous pouvez le faire ressembler a une non-fonction en prefixant les parentheses 
avec un plus unaire, qui ne fait absolument rien semantiquement parlant ; il ne conver- 
tit meme pas les arguments en numerique. 



78 



Chapitre 3 — Operateurs unaires et binaires 



Par exemple, puisque | | a une precedence plus faible que chdir, nous aurons : 



De meme pour n'importe quel operateur numerique qui est egalement un operateur 
unaire nomme, comme rand : 



En l'absence de parentheses, la precedence d'operateurs de liste comme print, sort, ou 
chmod est soit tres haute soit tres basse selon que vous regardez a gauche ou a droite de 
l'operateur (c'est le sens du « vers la gauche » dans le titre de cette section). Par exemple, 
dans : 

@tab = (1, 3, sort 4, 2); 

print (Stab; # imprime 1324 

Les virgules a droite de sort sont evaluees avant le sort, mais les virgules a sa gauche 
sont evaluees apres. En d'autres termes, un operateur de liste tend a avaler tous les argu- 
ments qui le suivent, puis a se comporter comme un simple terme pour l'expression qui 
le precede. II vous faut encore etre prudent avec les parentheses : 

# Ces arguments sont evalues avant de faire le print : 
print ($totOj exit); # Evidemment pas ce que vous voulez. 
print $totOj exit; # Ici non plus. 

# Ces lignes font le print avant d'evaluer l'exit : 
(print $toto)j exit; # C'est ce que vous voulez. 
print($toto) , exit; # Ici aussi. 

print ($toto)j exit; # Et meme ceci. 

Le cas le plus simple pour se faire pieger, c'est quand vous utilisez des parentheses pour 
grouper des arguments mathematiques, en oubliant que les parentheses servent aussi a 
regrouper les arguments de fonctions : 

print ($toto & 255) + 1, "\n"; # affiche ($toto & 255) 

Cela ne fait probablement pas ce a quoi vous vous attendiez au premier coup d'ceil. 
Heureusement, les erreurs de cette nature provoquent des avertissements comme 
« Useless use of addition in a void context » quand les avertissements sont actives 
(avec l'option de ligne de commande -w). 

Les constructions do {} et eval {} sont aussi analysees comme des termes, de meme 
que les appels de sous-programmes et de methodes, les createurs de tableaux et de ha- 
chages anonymes, [ ] et {}, et le createur de sous-programme anonymes sub {}. 



chdir $toto | | die; # (chdir $toto) | | die 

chdir($toto) j j die; # (chdir $toto) | | die 

chdir ($toto) j j die; # (chdir $toto) j | die 

chdir +($toto) | | die; # (chdir $toto) | | die 



mais comme * a une precedence plus grande que chdir, nous aurons : 



chdir $toto * 20; # chdir ($toto * 20) 

chdir($toto) * 20; # (chdir $toto) * 20 

chdir ($toto) * 20; # (chdir $toto) * 20 

chdir +($toto) * 20; # chdir ($toto * 20) 



rand 10 * 20; 
rand(lO) * 20; 
rand (10) * 20; 
rand +(10) * 20; 



# rand (10 * 20) 

# (rand 10) * 20 

# (rand 10) * 20 

# rand (10 * 20) 



L'operateur fleche 
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L'operateur fleche 

Tout comme en C et en C++, l'operateur binaire - >est un operateur infixe de dereferen- 
cement. Si a droite on trouve un indice de tableau entre [...], un indice de hachage 
entre { . . . } ou une liste d'arguments de sous-programme entre (...)> alors la partie a 
gauche de la fleche doit etre respectivement une reference (symbolique ou en dur) de 
tableau, de hachage ou de sous-programme. Dans un contexte de lvalue (oil Ton peut 
affecter une valeur), si la partie a gauche n'est pas une reference, elle doit etre capable 
de contenir une reference, auquel cas cette reference sera autovivifiee pour vous. Pour en 
savoir plus a ce sujet (et pour quelques avertissements sur l'autovivification accidentel- 
le), voir le chapitre 8, References. 

$aref->[42] # un dereferencement de tableau 

$href->{"corned beef"} # un dereferencement de hachage 
$sref->(l,2,3) # un dereferencement de sous-programme 

Sinon, c'est une sorte d'appel de methode. La partie a droite doit etre un nom de me- 
thode (ou une simple variable scalaire contenant le nom de la methode) et la partie a 
gauche doit s'evaluer soit comme un objet (une reference consacree), soit comme un 
nom de classe (c'est-a-dire un nom de paquetage) : 

$yogi = Ours->new("Yogi"); # un appel de methode de classe 
$yogi->pique($piquenique); # un appel de methode sur une instance 

Le nom de methode peut etre qualifiee avec un nom de paquetage pour indiquer dans 
quelle classe commencer a chercher la methode, ou avec le nom de paquetage special 
SUPER : : , pour indiquer que la recherche doit commencer dans la classe parente. Voir le 
chapitre 12, Objets. 

Auto-incrementation et autodecrementation 

Les operateurs ++ et - - fonctionnent comme en C. C'est-a-dire que, places avant une va- 
riable, ils l'incrementent ou la decrementent avant d'en renvoyer la valeur. Quand ils 
sont places apres, ils l'incrementent ou la decrementent apres en avoir renvoye la va- 
leur. Par exemple, $A++ 2 incremente la valeur de la variable $A et en retourne la valeur 
avant de realiser l'incrementation. De meme, --$b{(/(\w+)/)[o]} decremente l'ele- 
ment du hachage %b indexe par le premier « mot » de la variable de recherche par de- 
faut ($_) et renvoie la valeur apres la decrementation. 3 



2. N.d.T. : Pour d'interessantes variations sur $A++, vous pouvez consulter http://paris.mon- 
gueurs.net/aplusplus.html. 

3. Bon d'accord, ce n'etait pas tres sympa. Nous voulions juste etre surs que vous suiviez. Voici 
comment cette expression fonctionne. D'abord, la recherche de motif trouve le premier « mot » 
de $_ en utilisant l'expression reguliere \w+. Les parentheses qui l'entourent permettent de 
retourner le mot comme valeur dans une liste a un seul element car la detection se fait dans un 
contexte de liste. Le contexte de liste est fourni par l'operateur de tranche de liste, (...) [o], qui 
retourne le premier (et unique) element de la liste. Cette valeur est utilisee comme cle pour le 
hachage et l'entree du hachage (sa valeur) est decrementee et retournee. En general, quand vous 
etes confronte a une expression complexe, analysez-la de Pinterieur vers l'exterieur pour voir 
dans quel ordre les evenements se produisent. 



80 



Chapitre 3 — Operateurs unaires et binaires 



L'operateur d'auto-incrementation comporte en plus un peu de magie. Si vous incre- 
mentez une variable qui est numerique, ou qui a ete utilisee a un moment donne dans 
un contexte numerique, vous avez une incrementation normale. Si au contraire la va- 
riable n'a ete utilisee que dans des contextes de chaine depuis qu'elle a ete affectee, que 
sa valeur est non nulle et correspond au motif / A [a-zA-Z]*[0-9]*$/, l'incrementation 
est faite sur la chaine, en preservant chaque caractere dans son domaine, avec une rete- 
nue : 

print ++($toto = '99'); # prints '100' 

print ++($toto = 'a9'); # prints 'bo' 

print ++($toto = 'kz'); # prints 'Ba' 

print ++($toto = 'zz'); # prints J aaa' 

A l'heure oil nous ecrivons ces lignes, Fauto-incrementation magique n'a pas ete eten- 
due aux lettres et chiffres Unicode, mais pourrait l'etre dans le futur. 

L'operateur d'autodecrementation n'est, lui, pas magique, et il n'est pas prevu que cela 
change. 



Exponentiation 

L'operateur ** binaire est l'operateur d'exponentiation. Notez qu'il lie encore plus for- 
tement que le moins unaire ; c'est pourquoi -2**4 vaut - (2**4), et non (-2)**4. L'ope- 
rateur est implemente grace a la fonction pow(3) de C, qui fonctionne en interne avec 
des nombres en virgule f lottante. Les calculs sont faits grace a des logarithmes, ce qui 
signifie qu'il fonctionne avec des puissances fractionnaires, mais que vous obtiendrez 
parfois des resultats moins precis qu'avec une simple multiplication. 



Operateurs unaires ideographiques 

La plupart des operateurs portent simplement des noms (voir Operateurs unaires nom- 
mes et de test defichier plus loin dans ce chapitre), mais certains operateurs sont juges 
suffisament importants pour meriter leur propre representation symbolique speciale. 
Ces operateurs semblent tous avoir un rapport avec la negation. Plaignez-vous aupres 
des mathematiciens. 

Le ! unaire realise une negation logique, c'est-a-dire un « non ». Voyez not pour une 
version de moindre precedence du non logique. La valeur d'un operande nie est vraie 
(1) si l'operande est faux (0 numerique, chaine "0", chaine vide ou valeur indefinie) et 
fausse (" ") si l'operande est vrai. 

Le - unaire effectue une negation arithmetique si son operande est numerique. Si l'ope- 
rande est un identificateur, une chame composee d'un signe moins concatene a l'iden- 
tificateur est renvoyee. Sinon, si la chaine commence avec un plus ou un moins, une 
chaine commencant avec le signe oppose est renvoyee. Un des effets de ces regies est que 
-motsimple est equivalent a "-motsimple". C'est particulierement utile aux program- 
meurs Tk. 

Le ~ unaire realise une negation sur les bits, c'est-a-dire un complement a 1. Par defini- 
tion, ce n'est pas vraiment portable quand c'est limite par la taille du mot-machine de 
votre ordinateur. Par exemple, sur une machine 32 bits ~123 vaut 4294967172, tandis 
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que sur une machine 64 bits, cela vaut 18446744073709551492. Mais vous le saviez deja. 

Ce que vous ne saviez peut-etre pas, c'est que si Fargument de ~ est une chame au lieu 
d'un nombre, une chame de meme longueur est renvoyee avec tous ses bits comple- 
mented. C'est une maniere rapide de basculer un grand nombre de bits d'un coup, et de 
facon portable puisque cela ne depend pas de la taille de votre mot-machine. Plus tard 
nous verrons aussi les operateurs logiques sur les bits, qui ont eux des variantes pour les 
chaines. 

Le + n'a aucun effet semantique, meme sur les chames. Son utilite est surtout syntaxi- 
que, pour separer le nom d'une fonction d'une expression entre parentheses qui serait 
sinon interpretee comme la liste complete des arguments de la fonction. (Voir les exem- 
ples dans la section Termes et operateurs de listes (vers la gauche).) Si vous y reflechissez 
d'une maniere un peu detournee, le + inverse l'effet qu'ont les parentheses de changer 
les operateurs prefixes en fonctions. 

Le \ cree une reference sur ce qui le suit. Utilise sur une liste, il cree une liste de referen- 
ces. Voir la section L'operateur antislash au chapitre 8 pour plus de details. Attention a ne 
pas confondre ce comportement avec celui de l'antislash dans une chame, bien que les 
deux formes comportent la notion vaguement negative de protection de leurs argu- 
ments contre Finterpretation. Cette ressemblance n'est pas purement fortuite. 

Operateurs de liaison 

Le =~ binaire lie une expression scalaire a un operateur de recherche de motif, de subs- 
titution ou de translitteration (negligemment appelee traduction). Ces operations cher- 
cheraient ou modifieraient sinon la chame contenue dans $_(la variable par defaut). La 
chame a lier est placee a gauche, tandis que l'operateur lui-meme est place a droite. La 
valeur de retour indique le succes ou Fechec de l'operation effectuee a droite, puisque 
l'operateur de lien ne fait rien par lui-meme. 

Si Fargument de droite est une expression plutot qu'une recherche de motif, une subs- 
titution ou une translitteration, il sera interprete comme une recherche de motif a l'exe- 
cution. C'est-a-dire que $_ =~ $pat est equivalent a $_ =~ /$pat/. C'est moins efficace 
qu'une recherche explicite, puisque le motif doit etre verifie et potentiellement recom- 
pile a chaque fois que l'expression est evaluee. Vous pouvez eviter cette recompilation 
en precompilant le motif original avec l'operateur qr/7 de citation d'expression regulie- 
re (« quote regex » en anglais). 

Le ! ~ binaire est identique a =~sauf que la valeur de retour est inversee logiquement. 
Les expressions suivantes sont fonctionnellement equivalentes : 

$chaine !~ /pattern/ 
not $chaine =~ /pattern/ 

Nous avons dit que la valeur de retour indique le succes, mais il existe plusieurs sortes 
de succes. La substitution renvoie le nombre de substitutions reussies, comme la trans- 
litteration. (En fait, la translitteration sert souvent a compter les caracteres.) Puisque 
n'importe quel resultat non nul est vrai, tout fonctionne. La forme de valeur vraie la 
plus spectaculaire est une valeur de liste : en contexte de liste, les recherches de motif 
peuvent renvoyer les sous-chames capturees par les parentheses dans le motif. Confor- 
mement aux regies de Faffectation de liste, cette affectation retournera vrai si quelque 
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chose a ete detecte et affecte, et faux dans le cas contraire. C'est pourquoi vous voyez par- 
fois des choses comme : 

if ( ($c,$v) = $chaine =~ m/(\w+)=(\w*)/ ) { 
print "CLE $c VALEUR $v\n"; 

} 

Decomposons tout cela. Le =~ a la precedence sur =, il se produit done en premier. Le 
=~lie $chaine a la recherche de motif a droite. Celle-ci recherche ce qui ressemble a 
CLE=VALEUR dans votre chaine. II se trouve en contexte de liste, car du cote droit d'une 
affectation de liste. Si le motif est trouve, il renvoie une liste a affecter a $c et $v. L'affec- 
tation de liste elle-meme se trouve dans un contexte scalaire et renvoie done 2, le nom- 
bre de valeurs a droite de Faffectation. Et il se trouve que 2 est vrai, puisque notre 
contexte scalaire est aussi un contexte booleen. Quand la recherche echoue, aucune va- 
leur n'est affectee, ce qui renvoie 0, qui est faux. 

Voir le chapitre 5, Recherche de motif, pour en savoir plus sur le fonctionnement des motifs. 

Operateurs multiplicatifs 

Perl fournit des operateurs proches de ceux de C : * (multiplication), / (division) et % 
(modulo). * et / fonctionnent exactement comme vous vous y attendez, en multipliant 
ou divisant leurs deux operandes. La division se fait en virgule f lottante, a moins que 
vous n'ayez specifie le pragma integer. 

L'operateur % convertit ses operandes en entiers avant de calculer le reste de la division 
entiere. (Neanmoins cette division est faite en virgule f lottante done vos operandes peu- 
vent faire 15 chiffres sur la plupart des machines 32 bits.) Supposons que nos deux ope- 
randes s'appellent $a et $b. Si $b est positif, alors le resultat de $a % $b est $a moins le 
plus grand multiple de $b inferieur a $a (ce qui veut dire que le resultat sera toujours 
dans l'intervalle 0 .. $b-l). Si $b est negatif, alors le resultat de $a % $b est $a moins 
le plus petit multiple de $b superieur a $a (ce qui veut dire que le resultat sera toujours 
dans l'intervalle $b+l . . 0). 

Quand on est a portee de use integer, % vous donne directement acces a l'operateur 
modulo tel qu'il est implemente par votre compilateur C. Cet operateur n'est pas bien 
defini pour les operandes negatifs, mais s'executera plus rapidement. 

Le x est l'operateur de repetition. En realite, il s'agit de deux operateurs. En contexte sca- 
laire, il retourne une chaine concatenee composee de l'operande de gauche repete le 
nombre de fois specifie par l'operande de droite. (Pour assurer la compatibility avec les 
versions precedentes, il le fait egalement en contexte de liste si l'argument de gauche 
n'est pas entre parentheses.) 

print x 80; # imprime une rangee de tirets 

print "\t" x ($tab/8), ' ' x ($tab%8); # tabule a la colonne $tab 

En contexte de liste, si l'operande de gauche est une liste entre parentheses, x fonctionne 
comme un replicateur de liste plutot que comme un replicateur de chaine. Cela peut 
servir a initialiser a la mime valeur tous les elements d'un tableau de longueur indeter- 
minee. 

(Sones = (1) x 80; # une liste de 80 1 

@ones = (5) x (Stones; # met tous les elements a 5 
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De la meme maniere, vous vous pouvez egalement utiliser x pour initialiser des tran- 
ches de tableaux et de hachages. 

(Seles = qw(du Perl aux cochons); 
@hash{(o>cies} = ("") x @cles; 

Si cela vous laisse perplexe, remarquez que @cles est utilise a la fois comme une liste a 
gauche de l'affectation et comme une valeur scalaire (qui renvoie la longueur du ta- 
bleau) a droite. L'exemple precedent a le meme effet sur %hash que : 

$hash{du} = ""; 

$hash{Perl} = ""; 

$hash{aux} = ""; 

$hash{cochons} = ""; 

Operateurs additifs 

Etonnament, Perl dispose des operateurs usuels + (addition) et - (soustraction). Ces 
deux operateurs convertissent leurs arguments de chame en valeurs numeriques si ne- 
cessaire, et renvoient un resultat numerique. 

Perl fournit egalement l'operateur . qui realise la concatenation de chaines. Par exem- 
ple : 

$presque = "Fred" . "Pierrafeu"; # renvoie FredPierrafeu 

Remarquez que Perl n'ajoute pas d'espace entre les chaines concatenees. Si vous voulez 
l'espace ou si vous avez plus de deux chaines a concatener, vous pouvez utiliser l'opera- 
teur join, decrit au chapitre 29, Fonctions. Cependant, la plupart du temps on concatene 
implicitement dans une chaine entre doubles apostrophes : 

$nomcomplet = "$prenom $nom"; 

Operateurs de decalage 

Les operateurs de decalage de bits (<< et >>) renvoient la valeur de l'argument de gauche 
decale a gauche (<<) ou a droite (>>) du nombre de bits specifie par l'argument de droi- 
te. Les arguments doivent etre des entiers. Par exemple : 

l << 4; # renvoie 16 
32 » 4; # renvoie 2 

Faites attention cependant, car les resultats sur de grands nombres (ou sur des nombres 
negatifs) peuvent dependre du nombre de bits utilises par votre machine pour repre- 
senter les entiers. 

Operateurs unaires nommes et de test de fichier 

Certaines des « fonctions » decrites au chapitre 29 sont en fait des operateurs unaires. 
Le tableau 3-2 liste tous les operateurs unaires nommes. 

Les operateurs unaires nommes ont une precedence superieure a celle de certains ope- 
rateurs binaires. Par exemple : 

sleep 4 | 3; 
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Tableau 3-2. Operateurs unaires nommes 



-X (tests de fichiers) 


gethostbyname 


localtime 


return 


alarm 


get netby name 


lock 


rmdir 


caller 


getpgrp 


log 


scalar 


chdir 


get protoby name 


lstat 


sin 


chroot 


glob 


mv 

V 


sleep 


cos 


gmtime 


oct 


sqrt 


defined 


goto 


ord 


srand 


delete 


hex 


quotemeta 


stat 


do 


int 


rand 


uc 


eval 


lc 


readlink 


ucfirst 


exists 


lcfirst 


ref 


umask 


exit 


length 


require 


undef 



ne dort pas pendant 7 secondes ; il dort pendant 4 secondes puis prend la valeur de re- 
tour de sleep (typiquement zero) et la combine par OU avec 3, comme si l'expression 
avait des parentheses comme suit : 

(sleep 4) | 3; 

A comparer avec : 

print 4 | 3; 

qui prend ef f ectivement la valeur de 4 combine par OU avec 3 avant de l'afficher (7 
dans ce cas), comme s'il etait ecrit : 

print (4 | 3); 

En effet, print est un operateur de liste, et non un simple operateur unaire. Une fois 
que vous saurez quels operateurs sont des operateurs de liste, vous n'aurez plus de pro- 
bleme pour distinguer les operateurs de liste des operateurs unaires. En cas de doute, 
vous pouvez toujours utiliser des parentheses pour transformer un operateur unaire en 
fonction. Souvenez-vous, si ca ressemble a une fonction, c'est une fonction. 

Une autre caracteristique curieuse des operateurs unaires nommes est que beaucoup 
d'entre eux prennent $_ comme argument par defaut, si vous ne leur en fournissez pas 
d'autre. Cependant, si vous omettez l'argument et que ce qui suit ressemble au debut 
d'un argument, Perl va se tromper, car il attend un terme. Quand le caractere suivant 
du programme est Fun de ceux listes au tableau 3-3, le tokeniseur de Perl renvoie diffe- 
rents types de token selon qu'il attend un terme ou un operateur. 

Une erreur typique est done : 

next if length < 80; 

ou pour l'analyseur le < ressemble au debut du symbole <> (un terme) au lieu du 
« inferieur a » (un operateur) auquel vous pensiez. II n'existe pas vraiment de moyen 
d'arranger les choses tout en gardant Perl pathologiquement eclectique. Si vous etes pa- 
resseux au point de ne pouvoir vous resoudre a taper les deux caracteres $_, l'une de ces 
instructions devrait faire l'affaire : 
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Tableau 3-3. Caracteres ambigus 



Caractere 


Operateur 


Terme 


+ 


Addition 


Plus unaire 


_ 


Soustraction 


Moins unaire 


* 


Multiplication 


*typeglob 


/ 


Division 


/motif/ 


< 


Inferieur a, decalage a gauche 


<HANDLE>, «END 




Concatenation 


• 3333 


? 


? : 


?motif? 


% 


Modulo 


%assoc 


& 


&, && 


Ssousprogramme 



next if lengthQ < 80; 
next if (length) < 80; 
next if 80 > length; 
next unless length >= 80; 

Quand un terme est attendu, un signe moins suivi d'une lettre seule sera toujours inter- 
prete comme un test de fichier. Un operateur de test de fichier est un operateur 
unaire qui prend commme argument un nom ou un handle de fichier, et teste le fichier 
associe pour savoir si une certaine propriete est vraie a son sujet. Si l'argument est omis, 
il teste $_, sauf pour -t, qui teste STDIN. Sauf si c'est indique autrement dans la docu- 
mentation, il retourne 1 pour vrai et " " pour faux, ou la valeur indefinie si le fichier 
n'existe pas ou n'est pas accessible. Les operateurs de test de fichier actuellement imple- 
mented sont listes au tableau 3-4. 



Tableau 3-4. Operateurs de test de fichier 



Operateur 


Signification 


-r 


Fichier lisible par l'UID/GID effectif 


-w 


Fichier en ecriture pour l'UID/GID effectif. 


-X 


Fichier executable par l'UID/GID effectif. 


-0 


Fichier possede par l'UID/GID effectif. 


-R 


Fichier lisible par l'UID/GID reel. 


-W 


Fichier en ecriture pour l'UID/GID reel. 


-X 


Fichier executable par l'UID/GID reel. 


-0 


Fichier possede par l'UID/GID reel. 


-e 


Le fichier existe. 


-z 


Fichier de taille nulle. 


-s 


Fichier de taille non nulle (renvoie la taille) 


-f 


Fichier simple. 


-d 


Le fichier est un repertoire. 


-1 


Le fichier est un lien symbolique. 
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Tableau 3-4. Operateurs de test de fichier (suite) 


Operateur 


Signification 


-P 


Le fichier est un tube nomme (FIFO). 


-S 


Le fichier est une socket. 


-b 


Fichier special de type bloc 


-c 


Fichier special de type caractere. 


-t 


Handle de fichier ouvert sur un tty. 


-u 


Fichier avec bit setuid. 


-g 


Fichier avec bit setgid. 


-k 


Fichier avec sticky bit. 


-T 


Fichier texte. 


D 
- D 


ricnier Dinaire \ic contraire ue - i j. 


-M 


Age du fichier (au demarrage) en jours depuis sa modification. 


-A 


Age du fichier (au demarrage) en jours depuis le dernier acces. 


-C 


Age du fichier (au demarrage) en jours depuis le changement d'inode. 


Remarquez que - 


s/a/b/ ne fait pas une substitution negative. -exp($foo) fonctionne 



cependant comme prevu ; seules les lettres isolees qui suivent un signe moins sont in- 
terpretees comme des tests de fichier. 

^interpretation des operateurs de test de permissions -r, -R, -w, -W, -x et -X est fondee 
uniquement sur le mode du fichier et les ID d'utilisateur et de groupe de Futilisateur. 
II peut y avoir d'autres raisons pour lesquelles vous ne pouvez effectivement pas lire, 
ecrire ou executer le fichier, comme les listes de controle d'acces dAFS (Andrew File Sys- 
tem). 4 Notez egalement que pour le super utilisateur -r, -R, -w et -W renvoient toujours 
1, et que -x et -X renvoient 1 si l'un des bits d'execution est a 1 dans le mode. C'est pour- 
quoi les scripts lances par le super utilisateur peuvent necessiter un stat afin de connai- 
tre le veritable mode du fichier, ou bien remplacer temporairement l'UID par autre 
chose. 

Les autres operateurs de test de fichier se moquent de savoir qui vous etes. N'importe 
qui peut utiliser le test pour les fichiers « simples » : 

while (<>) { 
chomp; 

next unless -f $_; # ignore les fichiers "speciaux" 

} 

Les options -T et -B fonctionnent comme suit. Le premier bloc (plus ou moins) du fi- 
chier est examine a la recherche de caracteres inhabituels comme des code de controle 
ou des octets done le bit de poids fort est a 1 (et qui n'ont pas l'air d'etre de l'UTF-8). Si 
on trouve plus d'un tiers d'octets inhabituels, c'est un fichier binaire ; sinon c'est un fi- 



4. Vous pouvez cependant ignorer la semantique integree avec le pragma use f iletest. Voir le 
chapitre 31, Modules de pragmas. 
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chier texte. De meme, tout fichier dont le premier bloc contient le caractere ASCII NUL 
(\0) est considere comme binaire. Si -T ou -B est utilise sur un handle de fichier, le tam- 
pon d'entree standard (standard I/O ou « stdio ») en cours est examine, au lieu du pre- 
mier bloc du fichier. -T et -B renvoient vrai sur un fichier vide, ou sur un fichier a EOF 
(end-of-file : fin de fichier) quand on teste un handle. Comme Perl doit lire le fichier 
pour faire le test -T, vous devrez eviter de vous en servir sur des fichiers qui risquent de 
bloquer ou de vous causer des ennuis. C'est pourquoi la plupart du temps, vous devrez 
tester avec un -f d'abord, comme dans : 

next unless -f $fichier && -T $fichier; 

Si Ton donne a l'un des tests de fichier (ou a Fun des operateurs stat ou lstat) le han- 
dle special constitue d'un souligne unique, c'est la structure stat du dernier test de fi- 
chier (ou de l'operateur stat) qui est utilisee, economisant ainsi un appel systeme. (Cela 
ne marche pas avec -t, et il faudra vous souvenir que lstat et -1 laissent dans la struc- 
ture stat les valeurs pour le lien symbolique et non pour le fichier reel. De meme, - 1 
sera toujours faux apres un stat normal.) 

Voici quelques exemples : 

print "Fait F affaire. \n" if -r $a || -w _ | | -x _; 

stat($fichier); 

print "En lecture\n" if -r 

print "En ecriture\n" if -w 

print "ExecutableW if -x 

print "SetuidV if -u 

print "SetgidV if -g 

print "StickyNn" if -k 

print "Texte\n" if -T 

print "BinaireV if -B 

Les ages des fichiers donnes par -M, -A et -C sont en jours (avec partie fractionnaire) de- 
puis le moment ou le script a commence a tourner. Cette date est stockee dans la varia- 
ble speciale $ A T ($BASETIME). Done, si le fichier a ete modifie depuis que le script a 
demarre, vous obtiendrez une duree negative. Remarquez que comme la plupart des 
durees (86 399 sur 86 400 en moyenne) sont fractionnaires, il est generalement illusoire 
de tester l'egalite avec un entier sans passer par la fonction int. Exemples : 

next unless -M $fichier > .5; # fichier vieux de plus de 12 heures 

Snouveaufichier if -M $fichier < 0; # fichier plus recent que le processus 
Savertissemnt if int(-A) == 90; # fichier ($_) accede il y a 90 jours 

# aujourd'hui 

Pour remettre a la date courante la date de demarrage du script, ecrivez : 
$ A T = time; 



Operateurs relationnels 



Perl possede deux classes d'operateurs relationnels. L'une d'elles opere sur les valeurs 
numeriques et l'autre sur les valeurs de chaine, comme indique au tableau 3-5. 



88 



Chapitre 3 — Operateurs unaires et binaires 



Tableau 3-5. Operateurs relationnels 



Numerique 


Chaine 


Signification 


> 


gt 


Superieur a. 


>= 


ge 


Superieur ou egal a. 


< 


It 


Inferieur a. 


<= 


le 


Inferieur ou egal a. 



Ces operateurs renvoient 1 pour vrai et " " pour faux. Notez que les operateurs relation- 
nels sont non-associatifs, ce qui signifie que $a < $b < $c provoquera une erreur de 
syntaxe. 

En l'absence de declaration de locales, les comparaisons de chaines s'appuient sur l'ordre 
lexicographique ASCII/Unicode et, contrairement a certains autres langages informati- 
ques, les espaces finaux comptent pour la comparaison. Avec une declaration de locale, 
l'ordre lexicographique specifie par la locale est utilise. (Les mecanismes de tri fondes 
sur les locales peuvent plus ou moins bien interagir avec les mecanismes Unicode ac- 
tuellement en cours de developpement.) 

Operateurs d'egalite 

Les operateurs d'egalite listes au tableau 3-6 ressemblent beaucoup aux operateurs rela- 
tionnels. 



Tableau 3-6. Operateurs d'egalite 



Numerique 


Chaine 


Signification 




eq 


Egal a. 


! = 


ne 


Different de. 


<=> 


cmp 


Comparaison, avec resultat signe. 



Les operateurs egal et different renvoient 1 pour vrai et " " pour faux (exactement com- 
me les operateurs relationnels). Les operateurs <=> et cmp renvoient -1 si l'operande de 
gauche est inferieur a celui de droite, 0 s'il sont egaux et +1 si l'operande de gauche est 
superieur a celui de droite. Bien que ces operateurs semblent tres proches des operateurs 
relationnels, ils ont un niveau de precedence plus faible, et la syntaxe de $a < $b <=> 
$c < $d est done valide. 

Pour des raisons evidentes pour quiconque a vu Star Wars, l'operateur <=> est aussi con- 
nu sous le nom d'operateur « vaisseau spatial » (spaceship operator). 

Operateurs sur les bits 

Comme C, Perl dispose des operateurs ET, OU et OU-exclusif sur les bits : &, | et A . Vous 
avez bien sur remarque, apres votre etude attentive du tableau au debut de ce chapitre, 
que le ET sur les bits possede une precedence superieure aux autres ; nous avons triche 
pour tous les inclure dans cette discussion. 



Operateurs logique de type C (a court-circuit) 



89 



Ces operateurs fonctionnent differemment sur les valeurs numeriques et sur les chaines. 
(C'est l'un des rares cas oil Perl fait une difference.) Si Fun des operandes est un nombre 
(ou a ete utilise comme un nombre), les deux operandes sont convertis en entiers, puis 
Foperation sur les bits est effectuee. Ces entiers font au moins 32 bits de long, mais peu- 
vent faire 64 bits sur certaines machines. L'important est qu'il existe une limite arbitrai- 
re imposee par l'architecture de la machine. 

Si les deux operandes sont des chaines (et n'ont pas ete utilises comme des nombres de- 
puis leur derniere mise a jour), les operateurs font les operations sur les bits sur les bits 
correspondants des deux chaines. Dans ce cas, il n'y a aucune limite arbitraire, puisque 
les chaines ne sont pas limitees en taille. Si l'une des chaines est plus longue que l'autre, 
on considere que la plus courte dispose d'un nombre suffisant de bits a 0 pour comple- 
ter la difference. 

Par exemple, si vous faites un ET entre deux chaines : 

"123.45" & "234.56" 
vous obtenez une autre chaine : 

"020.44" 

Mais si vous faites un ET sur une chaine et un nombre : 

"123.45" & 234.56 
La chaine est d'abord convertie en nombre, ce qui donne : 

123.45 & 234.56 
Les nombres sont ensuite convertis en entiers : 

123 & 234 

ce qui donne 106. Remarquez que toutes les chaines de bits sont vraies (a moins de don- 
ner la chaine « 0 »). Cela signifie que si vous voulez verifier si Fun des octets resultant 
est non nul, vous ne devrez pas ecrire ceci : 

if ( "fred" & "\1\2\3\4" ){...} 

mais cela : 

if ( ("fred" & "\1\2\3\4") =~ /[ A \0]/ ){...} 

Operateurs logique de type C (a court-circuit) 

Comme C, Perl propose egalement les operateurs && (ET logique) et | | (OU logique). 
lis sont evalues de gauche a droite (&& ayant une precedence legerement superieure a 
celle de | | ) pendant le test de verite de Finstruction. Ces operateurs sont appeles opera- 
teurs court-circuit car ils determinent la verite de Finstruction en evaluant le plus petit 
nombre d'operandes possible. Par exemple, si Foperande a gauche d'un operateur && est 
faux, Foperande de droite ne sera jamais evalue car le resultat de Foperateur sera faux 
quelle que soit la valeur de Foperande de droite. 



Exemple 


Nom 


Resultat 


$a && $b 


Et 


$a si $a est faux, sinon $b. 


$a || $b 


Ou 


$a si $a est vrai, sinon $b. 
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Non seulement de tels courts-circuits font gagner du temps, mais ils sont frequemment 
utilises pour controler le flux de revaluation. Par exemple, un idiome courant en Perl 
est : 

open(FILE, "monf ichier") || die "Impossible cPouvrir monfichier: $!\n"; 

Dans ce cas, Perl evalue d'abord la fonction open. Si sa valeur est vraie (car monfichier a 
ete ouvert avec succes), l'execution de la fonction die n'est pas necessaire et est done 
omise. Vous pouvez litteralement lire « Ouvre mon fichier ou meurs ! ». 

Les operateurs && et | | different de ceux de C en ceci qu'au lieu de retourner 0 ou 1, ils 
renvoient la derniere valeur evaluee. Dans le cas de | | , cela a le delicieux effet de vous 
permettre de choisir la premiere valeur vraie d'une serie. Une maniere raisonnable- 
ment portable de trouver le repertoire personnel d'un utilisateur pourrait done etre : 

$home = $ENV{H0ME} 
| | $ENV{LOCDIR} 
|| (getpwuid($<))[7] 
| | die "Vous etes SDF !\n"; 

D'un autre cote, comme l'argument de gauche toujours evalue en contexte scalaire, 
vous ne pouvez pas vous servir de | | afin choisir entre deux aggregats pour une affecta- 
tion : 

@a = @b || @cj # Ceci ne fait pas ce que vous voulez 

@a = scalar(@b) | | @cj # car voici ce que cela veut dire. 
@a = @b ? @b : @c; # En revanche cela marche bien. 

Perl fournit egalement des operateurs and et or de moindre precedence, que certains 
trouvent plus lisibles et qui ne vous forcent pas a utiliser des parentheses sur les opera- 
teurs de liste. Ils sont aussi a court-circuit. Voir le tableau 1-1 pour la liste complete. 

Operateur d'intervalle 

L'operateur d'intervalle . . comprend en fait deux operateurs differents selon le contexte. 

L'operateur est bi-stable, comme un flip-flop electronique, et emule l'operateur d'inter- 
valle de ligne (virgule) de sed, awk et d'autres editeurs. Chaque operateur . . scalaire me- 
morise son propre etat booleen. II est faux tant que son operande de gauche est faux. 
Une fois que l'operande de gauche est vrai, l'operateur reste vrai jusqu'a ce que l'operan- 
de de droite soit vrai, apres quoi l'operateur d'intervalle redevient faux. L'operateur ne 
devient pas faux jusqu'a sa prochaine evaluation. II peut tester l'operande de droite et 
devenir faux pendant la meme evaluation que celle sur laquelle il est devenu vrai (com- 
me l'operateur de aivk), mais renvoie vrai au moins une fois. Si vous ne voulez pas qu'il 
teste l'operande de droite avant la prochaine evaluation (comme l'operateur de sed) uti- 
lisez simplement trois points (...) au lieu de deux. Pour les deux operateurs . . et . . . , 
l'operande de droite n'est pas evalue tant que l'operateur se trouve dans l'etat faux, et 
l'operande de gauche n'est pas evalue tant que l'operateur est dans l'etat vrai. 

La valeur renvoyee est soit la chaine vide pour faux soit un numero de sequence (com- 
mencant a 1) pour vrai. Le numero de sequence est remis a zero pour chaque operateur 
d'intervalle rencontre. La chaine « EO » est accolee a la fin du numero de sequence final 
dans un intervalle, ce qui n'affecte pas sa valeur numerique, mais vous donne quelque 
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chose a chercher si vous voulez exclure l'element final. Vous pouvez exclure le point de 
depart en attendant que le numero de sequence soit plus grand que 1. Si l'un des ope- 
randes de . . est un litteral numerique, cet operande est implicitement compare a la va- 
riable $ . , qui contient le numero de ligne courant de votre fichier d'entree. Exemples : 

if (101 .. 200) { print; } # imprime la deuxieme centaine de lignes 
next line if (l .. / A $/); # passe les entetes d'un message 
s/ A /> / if (/ A $/ .. eof()); # cite le corps d'un message 

En contexte de liste, . . renvoie une liste de valeurs comptees a partir de la valeur de gau- 
che jusqu'a la valeur de droite (par increments de un). Cela sert a ecrire des boucles for 
(l. .10) et pour faire des tranches de tableaux : 

for (101 .. 200) { print; } # affiche 101102. . .199200 

@foo = @foo[0 .. $#foo]; # un no-op couteux 

|5)foo = @foo[ -5 .. # la tranche des 5 derniers elements 

Si la valeur de gauche est superieure a celle de droite, une liste vide est renvoyee. (Pour 
construire une liste en ordre inverse, voir l'operateur reverse.) 

Si ses operandes sont des chaines, l'operateur d'intervalle emploie l'algorithme d'auto- 
incrementation magique vu precedemment. 5 Vous pouvez done ecrire : 

@alphabet = ('A' .. 'I'); 
pour obtenir toutes les lettres de l'alphabet (latin), ou : 

$hexdigit = (0 .. 9, 'a' .. 'f')[$nombre & 15]; 
pour obtenir un chiffre hexadecimal, ou : 

@z2 = ('01' .. '31'); print $z2[$jour]j 
pour obtenir des dates avec un zero en tete. Vous pouvez egalement ecrire : 

(Sicombis = ('aa' .. 'zz'); 

pour obtenir toutes les combinaisons de deux lettres minuscules. Attention cependant 
a quelque chose comme : 

|5)grossescombis = (■'aaaaaa-' .. 'zzzzzz'); 

car cela va necessiter beaucoup de memoire. Pour etre precis, il faudra de Fespace pour 
stocker 308 915 776 scalaires. Esperons que vous avez une grosse partition de swap. Vous 
devriez vous interesser a une approche iterative. 

Operateur conditionnel 

L'operateur ? : est le seul operateur ternaire, comme en C. On l'appelle souvent l'opera- 
teur conditionnel, car il fonctionne comme un if-then-else, excepte qu'il peut etre inclus 
sans probleme dans d'autres expressions et fonctions, car e'est une expression et non une 
instruction. En tant qu'operateur ternaire, ses deux elements separent trois expressions : 

C0ND ? EXPR SI VRAI : EXPR_SI_FAUX 



5. Si la valeur finale specifiee n'est pas dans la sequence que l'incrementation magique produi- 
rait, la sequence continue jusqu'a ce que le prochain element soit plus long que la valeur finale. 
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Si la condition COND est vrai, seule l'expression EXPR_SI_VRAI est evaluee, et la valeur de 
cette expression devient la valeur de toute l'expression. Sinon, seule l'expression 
EXPR_SI_FAUX est evaluee, et sa valeur devient celle de toute l'expression. 

Le contexte scalaire ou de liste se propage vers le deuxieme ou le troisieme argument, 
selon celui qui est selectionne. (Le premier argument est toujours en contexte scalaire, 
puisque c'est une condition.) 

$a = $ok ? $b : $c; # donne un scalaire 
@a = $ok ? @b : @c; # donne un tableau 

$a = $ok ? @b : @c; # donne le nombre d'elements d'un tableau 

Vous verrez souvent l'operateur conditionnel inclus dans des listes de valeurs a formater 
avec printf, car personne n'a envie de dupliquer une instruction complete juste pour 
basculer entre deux valeurs proches. 

printf "D'ai %d chameau%s.\n", 

$n, $n <= 1 ? "" : "x"; 

La precedence de ? : est opportunement plus grande que celle de la virgule, mais infe- 
rieure a celle de la plupart des operateurs que vous utiliserez a l'interieur (comme == 
dans cet exemple) ; vous n'aurez done generalement pas a utiliser de parentheses. Mais 
vous pouvez ajouter des parentheses pour clarifier, si vous voulez. Pour les operateurs 
conditionnels emboites a l'interieur de la partie EXPR_SI_VRAI d'autres operateurs con- 
ditionnels, nous vous suggerons de de faire des sauts de ligne et d'indenter comme s'il 
s'agisait d'instruction if ordinaires : 

$bissextile = 

$annee % 4 == 0 

? $annee % 100 == 0 
? $annee % 400 == 0 
? 1 
: 0 

: 1 

: 0; 

Pour les conditions imbriquees dans des parties EXPR_SI_FAUX d'operateurs condition- 
nels precedents, vous pouvez faire quelque chose d'equivalent : 

$bissextile = 
$annee % 4 
? 0 

: $annee % 100 
? 1 

: $annee % 400 
? 0 
: l; 

mais il est habituellement preferable d'aligner verticalement toutes les COND et les 
EXPR_SI_VRAI : 

$bissextile = 

$annee % 4 ? 0 : 

$annee % 100 ? 1 : 

$annee % 400 ? 0 : 1; 
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Meme des structures assez encombrees peuvent s'eclaircir en alignant les points d'inter- 
rogation et les deux-points : 

printf "Ouij j'aime mon livre du %s!\n", 

$il8n eq "anglais" ? "camel" : 
$il8n eq "allemand" ? "Kamel" : 
$il8n eq "japonais" ? "\x{99Fl}\x{99DD}" : 
"chameau" 

Vous pouvez affecter a Foperateur conditionnel 6 si le deuxieme et le troisieme argu- 
ments sont tous les deux des foa/ueslegales (c'est-a-dire qu'on peut leur arTecter une va- 
leur), et que tous deux sont soit des scalaires, soit des listes (sinon Perl ne saura pas quel 
contexte fournir a la partie droite de l'affectation) : 

($a_ou_b ? $a : $b) = $c; # donne la valeur de $c soit a $a, soit a $b 

Souvenez-vous que Foperateur conditionnel lie encore plus fort que les multiples ope- 
rateurs d'affectation. C'est habituellement ce que vous voulez (voir l'exemple $bissex- 
tile plus haut, par exemple), mais vous ne pourrez pas obtenir l'effet inverse sans 
parentheses. L'utilisation d'affectations dans un operateur conditionnel vous attirera des 
ennuis, et vous risquez meme de ne pas avoir d'erreur a l'analyse car Foperateur condi- 
tionnel peut etre analyse comme une lvalue. Par exemple, vous pourriez ecrire ceci : 

$a % 2 ? $a += 10 : $a += 2 # FAUX 

Mais ce serait analyse comme cela : 

(($a % 2) ? ($a += 10) : $a) += 2 

Operateurs d'affectation 

Perl reconnait les operateurs d'affectation de C, et fournit egalement les siens. II y en a 
un certain nombre : 

**= += *= &= «= &&= 
-= /= |= »= || = 
%= 
x= 

Chaque operateur necessite une lvalue cible (typiquement une variable ou un element 
de tableau) a sa gauche et une expression a sa droite. Pour Foperateur d'affectation 
simple : 

CIBLE = EXPR 

La valeur de EXPR est stockee dans la variable ou a Fendroit designe par CIBLE. Pour les 
autres operateurs, Perl evalue l'expression : 

CIBLE 0P= EXPR 

comme s'il etait ecrit : 

CIBLE = CIBLE OP EXPR 



6. Cela ne garantit pas une amelioration de la lisibilite de votre programme. Mais ca peut servir 
a construire des participations sympas pour un concours de Perl assombri (Obfuscated Perl Con- 
test). 
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C'est un bon moyen mnemotechnique, mais il est trompeur, et de deux manieres. 
D'abord les operateurs d'affectation sont analyses au niveau de precedence des affecta- 
tions ordinaires, quelle que soit la precedence que l'operateur OP aurait eu par lui-me- 
me. Ensuite, CIBLE n'est evalue qu'une seule fois. Habituellement cela n'a aucune 
importance, sauf en cas d'effets secondaires, comme pour une auto-incrementation. 

$var[$a++] += $valeur; # $a is increments une fois 

$var[$a++] = $var[$a++] + $valeur; # $a is increments deux fois 

A la difference de C, l'operateur d'affectation produit une lvalue valide. Modifier une 
affectation revient a faire l'affectation puis a modifier la variable a laquelle on vient d'af- 
fecter une valeur. Cela peut servir a modifier une copie de quelque chose, comme ceci : 

($tmp = $global) += $constante; 
qui est equivalent a : 

$tmp = $global + $constante; 
De meme : 

($a += 2) *= 3; 

est equivalent a : 

$a += 2; 
$a *= 3; 

Ce n'est pas tellement utile, mais voici un idiome frequent : 

($nouveau = $ancien) =~ s/toto/titi/g; 

Dans tous les cas, la valeur de l'affectation est la nouvelle valeur de la variable. Comme 
les operateurs d'affectations sont associatifs de droite a gauche, cela peut servir a affecter 
la meme valeur a plusieurs variables, comme dans : 

$a = $b = $c = 0; 

qui affecte 0 a $c et le resultat de cette operation (toujours 0) a $b, puis le resultat de 
(toujours 0) a $a. 

Les affectations de listes ne se font qu'avec l'operateur d'affectation simple, =. Dans un 
contexte de liste, une affectation de liste retourne la liste des nouvelles valeurs, tout 
comme l'affectation scalaire. En contexte scalaire, une affectation de liste renvoie le 
nombre de valeurs qui etaient disponibles a droite de l'affectation, comme indique au 
chapitre 2, Composants de Perl. Cela sert pour tester les fontions qui renvoient une liste 
vide quand elles echouent (ou finissent par echouer), comme dans : 

while (($cle, $valeur) = each %gloss) { ... } 
next unless ($dev, $ino, $mode) = stat $fichier; 

Operateurs virgule 

Le « , » binaire est l'operateur virgule. En contexte scalaire, il evalue son argument de 
gauche en contexte vide, jette le resultat, puis evalue son argument de droite et retourne 
cette valeur. Exactement comme l'operateur virgule de C. Par exemple : 

$a = (l, 3); 



Operateurs de liste (vers la droite) 
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affecte 3 a $a. Attention a ne pas confondre son utilisation en contexte scalaire avec son 
utilisation en contexte de liste. Dans un contexte de liste, une virgule est juste le separa- 
teur des arguments de la liste et il insere ses deux arguments dans la LISTE. II ne jette 
aucune valeur. 

Par exemple, si vous modifiez l'exemple precedent en : 
@a = (l, 3); 

vous construisez une liste de deux elements, tandis que : 

atan2(l, 3); 
appelle la fonction atan2 avec deux arguments. 

La plupart du temps, le digramme => est juste un synonyme pour l'operateur virgule. II 
sert a documenter les arguments apparies. II force egalement l'interpretation comme 
chaine de tout identificateur place a sa gauche. 

Operateurs de liste (vers la droite) 

La partie droite d'un operateur de liste commande tous les arguments de l'operateur de 
liste, qui sont separes par des virgules ; done la precedence d'un operateur de liste est 
plus faible que celle de la virgule, si vous regardez vers la droite. Une fois qu'un opera- 
teur de liste commence a avaler des arguments separes par des virgules, les seules choses 
qui l'arretent sont les tokens qui terminent Fexpression toute entiere (comme les 
points-virgules ou les modificateurs d'instructions) ou les tokens qui terminent la sous- 
expression en cours (comme les parentheses ou les crochets fermants) ou les operateurs 
logiques de faible precedence dont nous aller parler tout de suite. 

And, or, not et xor logiques 

Perl fournit les operateurs and, or, et not comme alternatives de moindre precedence a 
&&, | | , et ! . Le comportement de ces operateurs est identique — en particulier, and et 
or court-circuitent comme leurs alter-egos, ce qui leur donne leur utilite non seulement 
pour les expressions logiques, mais aussi pour le controle du flux d'evaluation. 

Comme la precedence de ces operateurs est beaucoup plus basse que celle des opera- 
teurs empruntes a C, vous pouvez les utiliser en toute securite apres un operateur de 
liste, sans qu'il soit besoin de parentheses. 

unlink "alpha", "beta", "gamma" 
or enrageQ, next LICNE; 

Avec les operateurs issus de C, vous auriez du l'ecrire comme ceci : 

unlink("alpha", "beta", "gamma") 
| | (enrageQ, next LIGNE); 

Mais vous ne pouvez pas simplement remplacer toutes les occurences de | | par or. Sup- 
posons que vous changiez ceci : 

$xyz = $x | | $y | | $z; 

en cela : 

$xyz = $x or $y or $z; # FAUX 
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Cela ne ferait pas du tout la meme chose ! La precedence de l'affectation est superieure 
a celle de or mais plus basse que celle de | | , done on affecterait toujours $x a $xyz pour 
ensuite seulement faire les or. Pour obtenir le meme resultat qu'avec | | , vous devrez 
ecrire : 

$xyz = ( $x or $y or $z ); 

La morale de cette histoire, e'est qu'il faut toujours apprendre les regies de precedence 
(ou utiliser les parentheses) quels que soient les operateurs logiques que vous utilisez. 

II existe egalement un xor logique qui n'a pas d'equivalent exact en C ou en Perl, puis- 
que le seul autre operateur OU-exclusif ( A ) travaille sur les bits. L'operateur xor ne peut 
pas court-circuiter, car les deux cotes doivent etre evalues. Le meilleur equivalent de $a 
xor $b est peut-etre ! $a ! = ! $b. On pourrait egalement ecrire ! $a A ! $b ou meme $a 
? ! $b : ! ! $b, bien star. L'essentiel est que $a et $b doivent tous les deux etre evalues 
comme vrais ou faux dans un contexte booleen, et l'operateur sur les bits existant n'en 
fournit pas sans qu'on l'y aide. 

Operateurs C manquant en Perl 

Voici ce que C a et que Perl n'a pas : 
& unaire 

L'operateur adresse-de. L'operateur \ de Perl (qui fournit une reference) occupe la 
meme niche ecologique : 

$ref_var = \$var; 
Mais les references de Perl sont plus sures que les pointeurs de C. 
* unaire 

L'operateur de dereferencement d'adresse. Comme Perl ne connait pas les adresses, 
il n'a pas besoin de les dereferencer. En revanche, Perl a des references et ce sont 
done les caracteres de prefixe variable qui servent d'operateurs de dereference, tout 
en indiquant le type : $, @, % et &. Etonnament, il existe bien un operateur * de dere- 
ferencement, mais comme * est le drole de caractere indiquant un typeglob, vous 
ne l'utiliserez pas ainsi. 

(TYPE) 

L'operateur de transtypage. De toute facon, personne n'aime se faire transtyper. 



4 

Instructions et 
declarations 



Un programme Perl consiste en une sequence de declarations et d'instuctions. Une de- 
claration peut-etre placee partout oil une instruction peut l'etre, mais son effet premier 
se produit a la compilation. Certaines declarations jouent un double role en tant qu'ins- 
tructions, mais la plupart sont totalement transparentes a l'execution. Apres la compi- 
lation, la sequence d'instructions principale est executee une seule fois. 

Contrairement a beaucoup de langages de programmation, Perl n'impose pas de decla- 
rer explicitement les variables ; elles se mettent a exister a leur premiere utilisation, que 
vous les ayez declarees ou non. Si vous essayez d'utiliser la valeur d'une variable a la- 
quelle aucune valeur n'a jamais ete affectee, elle est traitee silencieusement comme si 
elle contenait 0 si vous vouliez un nombre, comme " " si vous vouliez une chaine ou sim- 
plement comme une valeur fausse si vous vouliez une valeur logique. Si vous preferez 
etre averti de Futilisation de valeurs non definies comme si elles etaient de veritables 
chaines ou nombres, ou meme traiter cette utilisation comme une erreur, la declaration 
use warnings s'en chargera ; voir la section Pragmas a la fin de ce chapitre. 

Cependant, si vous preferez, vous pouvez eventuelkment declarer vos variables, en utili- 
sant soit my ou our avant le nom de variable. Vous pouvez meme faire qu'utiliser une 
variable non declaree soit une erreur. C'est bien de vouloir de la discipline, encore faut- 
il la demander. Normalement, Perl ne s'interesse pas a vos habitudes de programma- 
tion ; mais avec la declaration use strict, l'utilisation de variables non declarees est 
detectee a la compilation. De nouveau, voir la section Pragmas. 

Instructions simples 

Une instruction simple est une expression evaluee pour ses effets secondaires. Toute ins- 
truction simple doit se terminer par un point-virgule, sauf si c'est la derniere instruction 
d'un bloc. Dans ce cas, le point-virgule est optionnel — Perl sait que vous en avez fini 
avec cette instruction, puisque vous avez fini le bloc. Mais mettez quand meme le point- 
virgule s'il s'agit d'un bloc multiligne, car vous pourriez bien ajouter une autre ligne par 
la suite. 
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Bien que des operateurs comme eval { }, do { } et sub { } ressemblent a des instructions 
composees, en fait ce n'en sont pas. Certes, ils permettent d'avoir plusieurs instructions 
a l'interieur, mais cela ne compte pas. Vus de l'exterieur, ces operateurs sont juste des 
termes dans une expression ; c'est pourquoi ils necessitent un point-virgule explicite 
quand ils sont utilises comme dernier element d'une instruction. 

Toute instruction simple peut etre optionnellement suivi d'un modificateur unique, 
juste avant le point-virgule final (ou la fin de bloc). Les modificateurs possibles sont : 

if EXPR 
unless EXPR 
while EXPR 
until EXPR 
foreach LISTE 

Les modificateurs if et unless fonctionnent comme peuvent s'y attendre les anglopho- 
nes : 

$trash->take( J out J ) if $you_love_me; # sors la poubelle si tu m'aimes 
shutupQ unless $you_want_me_to_leave; # tais-toi, sauf si tu veux que 

# je m-'en aille 

Les modificateurs while et until sont evalues de facon repetee. Comme notre lectorat 
anglophone pouvait s'y attendre, un modificateur while execute l'expression tant que 
sa propre expression reste vraie, tandis qu'un modificateur until continue de s'executer 
tant qu'elle reste fausse : 

$expression++ while -e "$file$expression"; 

kiss('me') until $I_die; # embrasse-moi jusqu'a la mort 

Le modificateur foreach (aussi orthographie for) est evalue une fois par element de sa 
LISTE, $_ etant un alias de l'element courant : 

s/java/perl/ for ^curriculum; 

print "champ: $_\n" foreach split /:/, $ligne; 

Les modificateurs while et until ont la semantique usuelle des boucles while (la condi- 
tion est evaluee en premier), sauf quand ils s'appliquent a un doBLOC (ou a l'instruction 
maintenant depreciee doSUBROUTINE), auquel cas le bloc s'execute une fois avant que la 
condition soit evaluee. Cela vous permet d'ecrire des boucles comme : 

do { 

$ligne = <STDIN>; 

} until $ligne eq "An"; 

Voyez aussi les trois differentes entrees de do au chapitre 29, Fonctions. Remarquez ega- 
lement que les operateurs de controle de boucle decrits plus loin ne fonctionnent pas 
dans cette construction, car les modificateurs de boucles ne prennent pas d'etiquette. 
Vous pouvez toujours placer un bloc supplementaire autour pour terminer plus tot, ou 
a l'interieur pour iterer avant la fin de la boucle, comme cela est decrit dans la section 
Blocs simples. Ou bien vous pourriez ecrire une vraie boucle avec plusieurs commandes 
de controle de boucle a l'interieur. A propos de vraies boucles, nous allons maintenant 
parler des instructions composees. 



Instructions composees 
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Instructions composees 

On appelle bloc une sequence d'instructions definie dans une portee . Parfois la portee 
s'etend sur un fichier tout entier, comme par exemple un fichier appele avec require 
ou le fichier contenant votre programme principal. D'autres fois la portee a l'etendue 
d'une chaine evaluee avec eval. Mais en general, un bloc est entoure d'accolades ({}). 
Quand nous parlons de portee, cela signifie n'importe laquelle de ces trois possibilites. 
Quand nous voudrons dire un bloc entoure d'accolades, nous emploierons le terme 
BLOC. 

Les instructions composees sont construites a partir d'expressions et de BLOC. Les expres- 
sions sont construites a partir de termes et d'operateurs. Dans nos descriptions syntaxi- 
ques, nous utiliserons le mot EXPR pour indiquer un emplacement ou vous pouvez 
utiliser n'importe quelle expression scalaire. Pour indiquer une expression evaluee en 
contexte de liste, nous dirons LISTE. 

Les constructions suivantes peuvent etre utilisees pour controler l'execution de BLOC de 
facon conditionnelle ou repetee. (L'etiquette LABEL est optionnelle.) 

if (EXPR) BLOC 

if (EXPR) BLOC else BLOC 

if (EXPR) BLOC elsif (EXPR) BLOC . . . 

if (EXPR) BLOC elsif (EXPR) BLOC . . . else BLOC 



unless (EXPR) BLOC 

unless (EXPR) BLOC else BLOC 

unless (EXPR) BLOC elsif (EXPR) BLOC . . . 

unless (EXPR) BLOC elsif (EXPR) BLOC . . . else BLOC 



LABEL while (EXPR) BLOC 

LABEL while (EXPR) BLOC continue BLOC 



LABEL until (EXPR) BLOC 

LABEL until (EXPR) BLOC continue BLOC 



LABEL for (EXPR; EXPR; EXPR) BLOC 



LABEL foreach (LISTE) BLOC 

LABEL foreach VAR (LISTE) BLOC 

LABEL foreach VAR (LISTE) BLOC continue BLOC 



LABEL BLOC 

LABEL BLOC continue BLOC 

Remarquez qu'a l'inverse de C et de Java, elles sont definies en termes de BLOC, et non 
d'instructions. Cela signifie que les accolades sont obligatoires ; les instructions isolees 
ne sont pas autorisees. Si vous voulez ecrire des conditions sans accolades, il y a plusieurs 
manieres de le faire. Les lignes suivantes font toutes la meme chose : 



1. Les portees et les espaces de nommage sont decrits au chapitre 2, Composants de Perl, a la sec- 
tion Noms. 
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unless (open(TOTO, $toto)) 
if (! open (TOTO, $toto)) 



{ die "Impossible d'ouvrir $toto: $!" } 
{ die "Impossible d'ouvrir $toto: $!" } 



die "Impossible d'ouvrir $toto: $!" 
die "Impossible d'ouvrir $toto: $!" 



unless open(T0T0, $toto); 
if ! open (TOTO, $toto)j 



open (TOTO, $toto) 
open TOTO, $toto 



II die 



Impossible d'ouvrir $toto: $!"; 
Impossible d'ouvrir $toto: $!"; 



or die 



Nous avons tendance a preferer les deux dernieres dans la plupart des cas. Elles sont plus 
lisibles que les autres, en particulier la version « or die ». Avec | | vous devez vous ha- 
bituer a utiliser les parentheses religieusement, tandis qu'avec la version or, ce n'est pas 
grave de les oublier. 

Mais la principale raison pour laquelle nous preferons les dernieres versions est qu'elles 
mettent la partie la plus importante de l'instruction au debut de la ligne, la oil vous la 
verrez le mieux. La gestion d'erreur est repoussee vers la droite, oil vous n'avez pas be- 
som d'y faire attention, sauf si vous le voulez 2 . Et si vous tabulez tous vos tests « or 
die » a la mime position a droite de chaque ligne, c'est encore plus facile a lire : 

chdir $dir or die "chdir $dir: $!"; 

open TOTO, $fichier or die "open $fichier: $!"; 

(Slines = <T0T0> or die "$fichier est vide ?"; 

close TOTO or die "close $fichier: $!"; 



L'instruction if est simple. Comme les BLOCs sont delimited par des accolades, il n'y ja- 
mais d'ambiguite pour savoir a quel if en particulier un else ou un elsif est lie. Dans 
une sequence donnee de BLOCs if/elsif/else, seul le premier dont la condition est vraie 
est execute. Si aucune des conditions n'est vraie, alors le BLOC else, s'il existe, est execu- 
te. C'est en general une bonne idee de mettre un else a la fin d'une chaine de elsif, 
afin de se premunir contre un cas oublie. 

Si vous utilisez unless a la place de if, le sens du test est inverse. C'est-a-dire que : 

unless ($x == l) ... 
est equivalent a : 

if ($x != 1) ... 
ou au plus laid : 



La portee d'une variable declaree dans la condition de controle s'etend de sa declaration 
jusqu'a la fin de l'instruction conditionnelle, y compris tous les elsif et l'eventuelle 
clause else finale, mais pas plus loin : 

if ((my $couleur = <STDIN>) =~ /rouge/i) { 



Instructions if et unless 



if (!($x == 1)) ... 



$valeur = OxffOOOO; 



} 



2. Tout comme pour cette note. 



Instructions de boucle 
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elsif ($couleur =~ /vert/i) { 
$valeur = OxOOffOO; 

} 

elsif ($couleur =~ /bleu/i) { 
$valeur = OxOOOOff; 

} 

else { 

warn "~$couleur' : composante RGB inconnue, le noir est selectionneAn"; 
$valeur = OxOOOOOO; 

} 

Apres le else, la variable $couleur est hors de portee. Si vous voulez que sa portee 
s'etende plus loin, declarez la variable plus tot. 

Instructions de boucle 

Dans leur syntaxe formelle, toutes les instructions de boucle comportent un LABEL (ou 
etiquette) facultatif (Vous pouvez mettre une telle etiquette sur n'importe quelle ins- 
truction, mais cela a une signification speciale pour les boucles.) S'il est present, le label 
consiste en un identificateur suivi de deux-points. II est courant d'ecrire l'etiquette en 
majuscules pour eviter tout conflit avec des mots reserves et les faire mieux ressortir. 
Bien que Perl ne se pose pas de probleme si vous utilisez un label qui a deja une signi- 
fication comme if ou open, vos lecteurs risquent de se tromper. 

Instructions while et until 

L'instruction while execute le bloc tant que EXPR est vraie. Si le mot while est remplace 
par until, le sens du test est inverse ; c'est-a-dire qu'il execute le bloc tant que EXPR est 
fausse. La condition est cependant toujours testee avant la premiere iteration. 

Les instructions while ou until comportent un bloc supplemental facultatif : le bloc 
continue. Ce bloc est execute a chaque fois que Ton acheve l'iteration, soit en sortant a 
la fin du premier bloc, soit par un next explicite (next est un operateur de controle de 
boucle qui passe a l'iteration suivante). En pratique, le bloc continue n'est pas tres uti- 
lise, mais il est present afin de pouvoir definir rigoureusement la boucle for dans la sec- 
tion qui suit. 

Contrairement a la boucle for que nous allons voir dans un moment, une boucle while 
ne localise jamais implicitement de variables dans sa condition de test. Cela peut avoir 
d'« interessantes » consequences quand des boucles while utilisent des variables globa- 
les comme variables de boucle. En particulier, consultez la section Operateur de lecture 
de ligne (Angle) au chapitre 2 pour voir comment une affectation implicite a la variable 
globale $_ peut se produire dans certaines boucles while, ainsi qu'un exemple de ges- 
tion de ce probleme en localisant explicitement $_. II est cependant preferable de decla- 
rer les autres variables de boucle avec my, comme dans l'exemple suivant. 

Une variable declaree dans la condition de test d'une instruction while ou d'un until 
est visible seulement dans le ou les blocs pilotes par ce test. Sa portee ne s'etend pas au- 
dela. Par exemple : 

while (my $ligne = <STDIN>) { 
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$ligne = lc $ligne; 

} 

continue { 

print $ligne; # toujours visible 

} 

# $ligne maintenant hors de portee 

Ici, la portee $ligne s'etend de sa declaration dans l'expression de controle a 1'ensemble 
de la boucle, y compris le bloc continue, mais pas au-dela. Si vous voulez que sa portee 
s'etende plus loin, declarez la variable avant la boucle. 

Bouclesfor 

La boucle for en trois parties comporte trois expressions separees par des points-virgu- 
les entre ses parentheses. Ces expressions sont respectivement l'initialisation, la condi- 
tion et la re-initialisation de la boucle. Ces trois expressions sont optionnelles (mais pas 
les points-virgules) ; si la condition est omise, elle est toujours vraie. La boucle for peut 
etre definie dans les termes de la boucle while correspondante. Ce qui suit : 

LABEL: 

for (my $i = 1; $i <= 10; $i++) { 
} 

est done identique a : 
{ 

my $i = 1; 
LABEL: 
while ($i <= 10) { 

} 

continue { 
$i++; 

} 

} 

sinon qu'il n'y a pas vraiment de bloc exterieur. (Nous l'avons juste mis la pour montrer 
les limites du my.) 

Si vous voulez iterer deux variables simultanement, il vous suffit de separer les expres- 
sions paralleles par des virgules : 

for ($i = 0, $bit = 0; $i < 32; $i++, $bit «= l) { 
print "Le bit $i is est a l\n" if $mask & $bit; 

} 

# les valeurs de $i et $bit persistent apres la boucle 

Ou bien declarer ces variables comme visibles seulement a l'interieur de la boucle for : 

for (my ($i, $bit) = (0, l); $i < 32; $i++, $bit «= l) { 
print "Le bit $i is est a l\n" if $mask & $bit; 

} 

# les $i et $bit de la boucle sont maintenant hors de portee 



Instructions de boucle 
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En plus des boucles habituelles sur les indices de tableaux, for a d'autres applications 
interessantes. II n'a meme pas besoin d'une variable de boucle explicite. Voici un exem- 
ple permettant d'eviter le probleme que vous rencontrez en testant explicitement la fin 
de fichier sur un descripteur de fichier interactif, provoquant ainsi le blocage du pro- 
gramme. 

$sur_un_tty = -t STDIN && -t STDOUT; 
sub prompt { print "yes? " if $sur_un_tty } 
for ( prompt (); <STDIN>; prompt () ) { 
# fait quelque chose 

} 

Une autre application traditionnelle pour le for en trois parties vient du fait que les 
trois expressions sont optionnelles et que la condition par defaut est vraie. Si vous omet- 
tez les trois expressions, vous obtenez une boucle infmie : 

for (;;) { 
} 

Ce qui est exactement equivalent a : 
while (1) { 

} 

Si la notion de boucle infinie vous inquiete, nous devrions souligner que vous pouvez 
toujours sortir de la boucle quand vous voulez avec un operateur de controle explicite 
de boucle comme last. Bien sur, si vous ecrivez le code de controle d'un missile de croi- 
siere, vous n'aurez jamais vraiment besoin de sortir de la boucle. Elle se terminera auto- 
matiquement au moment opportun. 3 

Boucles foreach 

La boucle foreach parcourt une liste de valeurs en affectant tour a tour chaque element 
de la liste a la variable de controle (VAR) : 

foreach VAR (LISTE) { 
} 

Le mot-cle foreach est juste un synonyme du mot-cle for, vous pouvez done utiliser au 
choix for et foreach, selon lequel vous trouvez le plus lisible dans une situation don- 
nee. Si VAR est omis, la variable globale $_ est utilisee. (Ne vous inquietez pas — Perl dis- 
tingue facilement for (@ARGV) de for ($i=0; $i<$#ARGV; $i++), car ce dernier 
contient des points-virgules.) Voici quelques exemples : 

$somme = 0; foreach $valeur ((^tableau) { $somme += $valeur } 

for $decompte (10,9,8,7,6,5,4,3,2,1, 'BOUM') { # compte a rebours 
print "$decompte\n"; sleep(l); 

} 



3. C'est-a-dire que les retombees de la boucle ont tendance a se produire automatiquement. 
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for (reverse 'B0\M' , 1 . . 10) { 
print "$_\n"; sleep(l); 

} 



# pareil 



for $champ (split /:/, $data) { 

print "Le champ contient : '$champ J \n"; 

} 



# toute expression de LISTE 



foreach $cle (sort keys %hash) { 
print "$cle => $hash{$cle}\n"; 

} 



Le dernier represente la maniere classique d'afficher les valeurs d'un hachage dans l'or- 
dre des cles. Consultez les entrees keys et sort au chapitre 29 pour des exemples plus 
elabores. 

II n'existe aucune maniere de savoir oil vous en etes dans une liste avec foreach. Vous 
pouvez comparer des elements adjacents en vous souvenant du precedent dans une va- 
riable, mais il faudra parfois vous contenter d'ecrire une boucle for en trois parties avec 
des indices. Apres tout, cet autre for est justement la pour ca. 

Si LISTE est entierement constitute d'elements auxquels on peut affecter une valeur 
(c'est-a-dire de variables, pas d'une enumeration de constantes), vous pouvez modifier 
chacune de ces variables en modifiant VAR a l'interieur de la boucle. Cela provient du 
fait que la variable d'indice de la boucle foreach est un alias implicite de chaque ele- 
ment de la liste sur laquelle vous bouclez. Vous pouvez non seulement modifier un ta- 
bleau d'un coup, mais egalement plusieurs tableaux ou hachages dans une seule liste : 

foreach $paye (@salaires) { # une augmentation de 8% 

$paye *= 1.08; 



La variable de boucle est valide uniquement dans la portee dynamique ou lexicale de la 
boucle et sera implicitement lexicale si la variable a ete precedemment declaree avec my. 
Cela la rend invisible a toute fonction definie en dehors de la portee lexicale de la varia- 
ble, mime si elle est appelee depuis cette boucle. Cependant si aucune declaration lexi- 
cale n'est a portee, la variable de boucle sera une variable globale localisee (a portee 
dynamique) ; cela permet aux fonctions appelees depuis la boucle d'acceder a cette va- 
riable. Dans tous les cas, la valeur qu'avait la variable localisee avant la boucle sera res- 
tauree a la sortie de la boucle. 

Si vous preferez, vous pouvez declarer explicitement quel type de variable (lexicale ou 
globale) utiliser. Ceux qui maintiennent votre code sauront plus facilement ce qui se 



} 




# change le menu 



s/pate/foie gras/; 

} 

s/pate/foie gras/ for @noel, @paques; # idem 



for ($scalaire, ^tableau, values %hash) { 

s/ A \s+//; # 

s/\s+$//; # 

} 



# retire les espaces initiaux 

# retire les espaces finaux 
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passe ; sinon, ils devront remonter la chaine des portees successives a la recherche d'une 
declaration pour deviner de quelle variable il s'agit : 

for my $i (l . . 10) { . . . } # $i toujours lexicale 

for our $Tick (l . . 10) { . . . } # $Tick toujours globale 

Quand une declaration accompagne la variable de boucle, l'ecriture courte for est tou- 
jours preferable a f oreach, car cela se lit mieux en anglais. 4 

Voici comment un programmeur C ou Java pourrait d'abord penser a ecrire un algorith- 
me donne en Perl : 

for ($i = 0; $i < @tabl; $i++) { 
for ($j = 0; $j < @tab2; $j++) { 
if ($tabl[$i] > $tab2[$j]) { 

last; # Impossible d'aller a la boucle externe. :-( 

} 

$tabl[$i] += $tab2[$j]; 

} 

# voici ou ce last m'emmene 

} 

Mais voici comment un programmeur Perl experimente pourrait l'ecrire : 

WID: foreach $ceci (@tabl) { 
DET: foreach $cela (@tab2) { 
next WID if $ceci > $cela; 
$ceci += $cela; 

} 

} 

Vous voyez combien c'etait simple en Perl idiomatique ? C'est plus propre, plus sur et 
plus rapide. C'est plus propre car il y a moins de bruit. C'est plus sur car si du code est 
ajoute par la suite entre les boucles interne et externe, ce code ne sera pas accidentelle- 
ment execute, car next (explique plus loin) reboucle sur la boucle externe 

Mais vous codez comme vous preferez. TMTOWTDI. 

Comme l'instruction while, l'instruction foreach peut aussi avoir un bloc continue. 
Cela vous permet d'executer un bout de code a la fin de chaque iteration de boucle, que 
vous en soyez arrive la par le cours normal des evenements ou par un next. 

Controle de boucle 

Nous avons deja mentionne que vous pouviez mettre un LABEL sur une boucle pour lui 
donner un nom. L'etiquette identifie la boucle pour les operateurs de controle de bou- 
cle next, last et redo. Le LABEL designe la boucle toute entiere, pas seulement le debut 
de celle-ci. Une commande de controle de boucle ne « va » pas au LABEL lui-meme. 
Pour l'ordinateur l'etiquette aurait aussi bien pu etre placee a la fin de la boucle. Mais 
il semble que les gens preferent les etiquettes au debut. 



4. NdT : D'une maniere generale, vous avez maintenant remarque qu'il est utile d'avoir des 
notions d'anglais si Ton veut profiter des subtilites de Perl (et de CPAN). 
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Les boucles sont typiquement nominees d'apres les elements qu'elles manipulent a cha- 
que iteration. Cela se combine bien avec les operateurs de controle de boucle, qui sont 
concus pour se lire comme de l'anglais quand ils sont utilises avec une etiquette apro- 
priee et un modificateur d'instruction. La boucle typique traite des lignes, done l'eti- 
quette de boucle typique est LINE : ou LIGNE : et l'operateur de controle de ligne typique 
ressemble a ceci : 

next LIGNE if / A #/; # supprime les commentaires 

La syntaxe des operateurs de controle de boucle est : 

last LABEL 
next LABEL 
redo LABEL 

Le LABEL est optionnel ; s'il est omis, l'operateur se refere a la boucle englobante la plus 
interne. Mais si vous voulez sauter plus d'un niveau, vous devez utiliser un LABEL pour 
designer la boucle sur laquelle agir. Ce LABEL n'a pas besoin d'etre dans la meme portee 
lexicale que l'operateur de controle, mais e'est probablement preferable. En fait, le LA- 
BEL peut etre n'importe oil dans la portee dynamique. Si cela vous force a sortir d'un 
eval ou d'un sous-programme, Perl emet un avertissement (sur demande). 

Tout comme vous pouvez avoir autant de return que vous voulez dans une fonction, 
vous pouvez avoir autant d'operateurs de controle de boucle que vous voulez dans une 
boucle. Cela n'a pas a etre considere comme mauvais ou pas cool. Aux debuts de la pro- 
grammation structuree, certaines personnes insistaient sur le fait que les boucles et les 
sous-programmes ne devaient avoir qu'une entree et qu'une sortie. La notion d'entree 
unique est toujours une bonne idee, mais la notion de sortie unique a conduit a l'ecri- 
ture de beaucoup de code artificiel. La programmation consiste principalement a par- 
courir des arbres de decision. Un arbre de decision commence naturellement par une 
racine unique mais se termine par de nombreuses feuilles. Ecrivez votre code avec le 
nombre de sorties de boucle (et de retours de fonction) qui est naturel pour le probleme 
que vous essayez de resoudre. Si vous avez declare vos variables dans des portees raison- 
nables, tout sera automatiquement nettoye le moment venu, quelle que soit la maniere 
dont vous quittez le bloc. 

L'operateur last sort immediatement de la boucle en question. Le bloc continue, s'il 
existe, n'est pas execute. L'exemple suivant s'ejecte de la boucle a la premiere ligne blan- 
che : 

LIGNE: while (<STDIN>) { 

last LIGNE if / A $/; # sort quand l'entete de mail est fini 

} 

L'operateur next passe le reste de l'iteration courante de la boucle et commence la sui- 
vante. S'il existe une clause continue sur la boucle, elle est executee juste avant que la 
condition soit re-evaluee, exactement comme la troisieme partie d'une boucle for. Elle 
peut done servir a incrementer une variable de boucle, meme si une iteration particu- 
liere de la boucle a ete interrompue par un next : 

LIGNE: while (<STDIN>) { 

next LIGNE if / A #/; # ignore les commentaires 

next LIGNE if / A $/; # ignore les lignes blanches 
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} continue { 
$compte++; 

} 

L'operateur redo redemarre le bloc de boucle sans reevaluer la condition. Le bloc con- 
tinue, s'il existe, n'est pas execute. Cet operateur s'utilise souvent pour des programmes 
qui veulent se cacher a eux-memes ce qui vient d'etre entre. Supposons que vous traitez 
un fichier dont les lignes sont parfois terminees par un antislash pour indiquer qu'elles 
continuent sur la ligne suivante. Voici un exemple d'utilisation de redodans ce cas : 

while (<>) { 
chomp; 

if (s/\\$//) { 
$_ .= <>; 

redo unless eof; # ne pas lire au-dela de la fin de chaque fichier 

} 

# traitement de $_ 

} 

qui est la version Perl usuelle du plus explicite (et laborieux) : 

LIGNE: while (def ined($ligne = <ARGV>)) { 
chomp($ligne); 
if ($ligne =~ s/\\$//) { 

$ligne .= <ARGV>; 

redo LIGNE unless eof(ARGV); 

} 

# traitement de $ligne 

} 

Voici un exemple tire d'un programme reel qui utilise les trois operateurs de controle 
de boucle. Bien que cette methode soit moins courante maintenant que nous disposons 
des modules Getopt : : * dans la distribution de Perl standard, c'est toujours une illustra- 
tion interessante de l'utilisation des operateurs de controle de boucle sur des boucles 
nominees et imbriquees : 

ARG: while (@ARGV && $ARGV[0] =~ s/ A -(?=.)//) { 
OPT: for (shift @ARGV) { 

m/ A $/ && do { next ARG; }; 

m/ A -$/ && do { last ARG; }; 

s/ A d// && do { $Niveau_Debug++; redo OPT; }; 

s/ A l// && do { $Genere_Listing++; redo OPT; }; 

s/ A i(.*)// && do { $Sur_Place = $1 | | ".bak"; next ARG; }; 
say_usage( "Option inconnue : $_"); 

} 

} 

Encore un mot au sujet des operateurs de controle de boucle. Vous avez peut-etre remar- 
que que nous ne les appelons pas « instructions ». Ce ne sont en effet pas des 
instructions — bien que comme toute expression, on puisse les utiliser comme des ins- 
tructions. Vous pouvez presque les considerer comme des operateurs unaires qui modi- 
fient le deroulement du programme. En fait, vous pouvez mime vous en servir la oil 
cela n'a aucun sens. On voit parfois cette erreur de codage : 
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open FICHIER, $fichier 

or warn "Impossible d'ouvrir $fichier : $!\n", next FICHIER; # FAUX 

L'intention est bonne, mais next FICHIER est analyse comme l'un des parametres de 
warn, qui est un operateur de liste. Done le next s'execute avant que le warn ait la moin- 
dre chance d'emettre son avertissement. Dans ce cas, cela se corrige facilement en chan- 
geant l'operateur de liste warn en la fonction warn a l'aide de parentheses bien placees : 

open FICHIER, $fichier 

or warn("Impossible d'ouvrir $fichier : $!\n"), next FICHIER; # Correct 

Neanmoins, vous trouverez peut-etre ceci plus facile a lire : 

unless (open FICHIER, $fichier) { 

warn "Impossible d'ouvrir $fichier: $!\n"; 
next FICHIER; 

} 

Blocs simples 

Un BLOC (etiquete ou non) est en soi l'equivalent semantique d'une boucle qui s'execute 
une seule fois. C'est pourquoi vous pouvez utiliser last pour quitter un bloc ou redo 
pour relancer le bloc. 5 Remarquez que ceci n'est pas le cas des blocs a l'interieur 
d'eval {}, de sub {} ou, ce qui en etonne beaucoup, de do {}. En effet, ce ne sont pas 
des blocs de boucle, car ce ne sont pas des blocs par eux-memes. Le mot-cle qui les pre- 
cede fait d'eux les termes d'expressions qui se trouvent contenir un bloc de code. N'etant 
pas des blocs de boucle, ils ne peuvent etre etiquetes et les controles de boucle ne s'y 
appliquent pas. Les controles de boucle ne s'appliquent qu'aux veritables boucles, tout 
comme return ne s'utilise que dans un sous-programme (ou un eval). 

Les controles de boucle ne marchent pas non plus avec un if ou un unless, puisque ce 
ne sont pas des boucles. Mais vous pouvez toujours ajouter une paire d'accolades sup- 
plementaires pour construire un bloc simple qui lui est une boucle : 

if (/pattern/) {{ 
last if /alpha/; 
last if /beta/; 
last if /gamma/; 

# ne fait quelque chose que si on se trouve encore dans le if() 

}} 

Voici comment utiliser un bloc pour faire fonctionner les operateurs de controle de 
boucle avec une construction do {}. Pour faire un next ou un redo sur un do, ajouter 
un bloc simple a l'interieur : 

do {{ 

next if $x == $y; 

# faire quelque chose ici 
}} until $x++ > $z; 



5. Pour des raisons qui peuvent (ou non) paraitre evidentes a la reflexion, un next permet ega- 
lement de sortir d'un bloc. II y a cependant une petite difference en ce qu'un next execute un 
bloc continue, ce qui n'est pas le cas d'un last. 
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Vous devez etre plus subtil pour last : 
{ 

do { 

last if $x = $y ** 2; 
# faire quelque chose ici 
} while $x++ <= $z; 

} 

Et si vous voulez vous servir des deux controles de boucle disponibles, vous allez devoir 
distinguer ces blocs avec des etiquettes : 

D0_LAST: { 

do { 

D0_NEXT: { 

next DOJIEXT if $x == $y; 
last DOLAST if $x = $y ** 2; 
# faire quelque chose ici 

} 

} while $x++ <= $z; 

} 

Mais quand vous en arrivez a ce point (ou meme avant), vous feriez mieux d'utiliser une 
simple boucle infinie avec un last a la fin : 

for (;;) { 

next if $x == $y; 
last if $x = $y ** 2; 
# faire quelque chose ici 
last unless $x++ <= $z; 

} 

Structures de cas 

Contrairement a d'autres langages de programmation, Perl n'a pas d'instruction switch 
ou case officielle. Perl n'en a pas besoin, puisqu'il y a plus d'une maniere de faire la 
meme chose. Un bloc simple est particulierement commode pour construire des struc- 
tures a choix multiples. En voici une : 

SWITCH: { 

if (/ A abc/) { $abc = 1; last SWITCH; } 
if (/ A def/) { $def = 1; last SWITCH; } 
if (/ A xyz/) { $xyz = 1; last SWITCH; } 
$rien = 1; 

} 

et une autre : 

SWITCH: { 
/ A abc/ 
/ A def/ 
/ A xyz/ 
$rien = 1; 

} 



&& do { $abc = l; last SWITCH; }; 
&& do { $def = l; last SWITCH; }; 
&& do { $xyz = l; last SWITCH; }; 
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ou, formate pour que chaque cas ressorte mieux : 

SWITCH: { 

/ A abc/ && do { 

$abc = 1; 
last SWITCH; 

}; 

/ A def/ && do { 

$def = 1; 
last SWITCH; 

}; 

/ A xyz/ && do { 

$xyz = 1; 
last SWITCH; 

}; 

$rien = 1; 

} 

ou meme, horreur : 

if (/ A abc/) { $abc = 1 } 

elsif (/ A def/) { $def = 1 } 

elsif (/ A xyz/) { $xyz = 1 } 

else { $rien = 1 } 

Remarquez comme dans cet exemple l'operateur last ignore les blocs do, qui ne sont 
pas des boucles, et sort de la boucle for : 

for ($nom_de_variable_tres_long[$i++] [$j++]->methode()) { 

/ce motif/ and do { push @flags, last; }; 

/celui-la/ and do { push (Sflags, '-h'; last; }; 

/quelque chose d'autre/ and do { last; }; 

die "valeur inconnue: "$_'"; 

} 

Vous pouvez trouver bizarre de boucler sur une seule valeur, puisque vous n'allez tra- 
verser qu'une fois la boucle. mais il est commode de pouvoir utiliser les capacites d'alias 
de f or/f oreach pour affecter $_ temporairement et localement. Cela rend les comparai- 
sons multiples a la meme valeur beaucoup plus faciles a taper et il est done plus difficile 
de se tromper. On echappe aux effets secondaires d'une nouvelle evaluation de l'expres- 
sion. Et pour rester en rapport avec cette section, e'est l'un des idiomes les plus repandus 
pour implementer une structure de cas. 

Pour des cas simples, une cascade d'operateurs ? : peut egalement marcher. Ici encore, 
nous utilisons les capacites d'alias de for afin de rendre les comparaisons multiples plus 
lisibles : 

for ($couleur_utilisateur) { 

$value = /rouge/ ? OxFFOOOO : 

/vert/ ? OxOOFFOO : 

/bleu/ ? OxOOOOFF : 

0x000000 ; # noir s'il n'y a plus d'espoir 

} 

Dans des situations comme celle-ci, il vaut parfois mieux vous construire un hachage et 
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le classer rapidement pour en tirer la reponse. Contrairement aux conditions en cascade 
que nous avons vues, un hachage peut croitre a un nombre illimite d'elements sans 
prendre plus de temps pour trouver le premier ou le dernier element. L'inconvenient 
est que vous ne pourrez faire que des comparaisons exactes et pas des recherches de mo- 
tif. Si vous avez un hachage comme celui-ci : 

%couleur = ( 

azur => OxFOFFFF, 

chartreuse => 0X7FFF00, 
lavande => OxE6E6FA, 
magenta => OxFFOOFF, 
turquoise => 0X40E0D0, 

); 

alors une recherche exacte de chaine tourne vite : 

$valeur = $couleur{ lc $couleur_utilisateur } | | 0x000000; 

Meme les instructions compliquees de branchement multiple (ou chaque cas implique 
l'execution de plusieurs instructions differentes) peuvent se transformer en une rapide 
consultation. Vous avez juste besoin de vous servir d'un hachage de references a des 
functions. Pour savoir comment les manipuler, voyez la section Hachages de fonctions au 
chapitre 9, Structures de donnees. 



goto 

Perl supporte aussi un operateur goto, mais il n'est pas destine aux cceurs sensibles. II 
se presente sous trois formes : goto LABEL, goto EXPftetgoto MOM. 

La forme goto LABEL trouve l'instruction etiquetee avec LABEL et reprend l'execution a 
partir de la. Elle ne peut pas servir a sauter a l'interieur d'une structure qui necessite 
une initialisation, comme un sous-programme ou une boucle f oreach. Elle ne peut pas 
non plus servir pour entrer dans une structure qui a ete eliminee lors de l'optimisation 
(voir le chapitre 18, Compilation). Elle peut servir pour aller a peu pres n'importe oil 
dans le bloc courant ou dans un bloc dans votre portee dynamique (c'est-a-dire un bloc 
duquel vous avez ete appele). Vous pouvez meme sortir d'un sous-programme par goto, 
mais il vaut en general mieux utiliser une autre construction. L'auteur de Perl n'a jamais 
ressenti le besoin d'utiliser cette forme de goto (en Perl ; en C, c'est une autre affaire). 

La forme goto EXPR n'est qu'une generalisation de goto LABEL. Elle attend de l'expres- 
sion qu'elle produise un nom d'etiquette, dont la position doit evidemment etre resolue 
dynamiquement par l'interpreteur. Cela permet des goto calcules a la FORTRAN, mais 
n'est pas necessairement recommande si vous cherchez a optimiser la maintenabilite du 
code : 

goto(("T0T0" J "TITI", "TUTU")[$i])j # en esperant que 0 <= i < 3 

@loop_label = qw/TOTO TITI TUTU/; 

goto $loop_label[rand @loop_label] ; # teleportation au hasard 

Dans presque tous les cas de ce genre, il est tres, tres largement preferable d'utiliser les 
mechanismes structures de controle de flux de next, last ou redo au lieu d'avoir re- 
cours a un goto. Pour certaines applications, un hachage de references a des fonctions 
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ou le mechanisme de capture et de gestion d'exceptions s'appuyant sur eval et die sont 
des approches prudentes. 

La forme goto &NAME est fortement magique et suffisamment eloignee du gotousuel 
pour exempter ceux qui Futilisent de l'opprobre qui couvre habituellement les utilisa- 
teurs de goto. Elle substitue a la routine en cours d'execution un appel au sous-program- 
me nomme. Ce fonctionnement est utilise par les routines AUTOLOAD pour charger un 
autre sous-programme et faire croire que c'est cet autre sous-programme qui etait appe- 
le. Apres le goto, meme caller ne pourra dire que cette routine a ete appelee en pre- 
mier. Les modules autouse, AutoLoader et Self Loader utilisent tous cette strategic pour 
definir les fonctions lorsqu'elles sont appelees pour la premiere fois puis les lancer sans 
que personne ne puisse jamais savoir que ces fonctions n'ont pas toujours ete la. 

Declarations globales 

Les declarations de sous-programmes et de formats sont des declarations globales. Oil 
que vous les placiez, ce qu'elles declarent est global (c'est local au paquetage, mais com- 
me les paquetages sont globaux au programme, tout ce qui est dans un paquetage est 
visible de partout). Une declaration globale peut etre placee partout oil Ton peut mettre 
une instruction, mais n'a aucun effet sur l'execution de la sequence primaire destruc- 
tions, les declarations prennent effet a la compilation. 

Cela signifie que vous ne pouvez pas faire de declaration conditionnelle de sous-pro- 
grammes ou de formats et les cacher du compilateur au moyen d'une condition qui ne 
sera prise en compte qu'a l'execution. Le compilateur voit les declarations de sous-pro- 
grammes et de formats (ainsi que les declarations use et no) oil qu'elles se produisent. 

Les declarations globales sont generalement mises au debut ou a la fin de votre pro- 
gramme, ou dans un autre fichier. Cependant si vous declarez des variables a portee lexi- 
cale (voir la section suivante), vous devrez vous assurer que vos declarations de formats 
et de sous-programmes sont a portee de vos declarations de variables si vous esperez ac- 
ceder a ces variables privees. 

Vous avez remarque que nous sommes sournoisement passes des declarations aux defi- 
nitions. Separer la definition de la declaration a parfois un interet. La seule difference syn- 
taxique entre les deux est que la definition fournit un BLOC contenant le code a executer, 
et pas la declaration. (Une definition de sous-programme agit comme une declaration 
si aucune declaration n'a ete vue.) Separer la definition de la declaration vous permet 
de mettre la declaration au debut du fichier et la definition a la fin (avec vos variables 
lexicales joyeusement au milieu) : 

sub compte (@); # Le compilateur sait maintenant comment appeler 

# compteQ . 

my $x; # Le compilateur connait maintenant la variable 

# lexicale. 

$x = compte (3 ,2,1); # Le compilateur peut valider l'appel de fonction. 
sub compte (@) { @_ } # Le compilateur sait maintenant ce que fait compteQ. 

Comme le montre cet exemple, les sous-programmes n'ont pas besoin d'etre definis 
avant que les appels vers eux soient compiles (en fait, leur definition peut meme etre 
repoussee jusqu'a leur premiere utilisation, si vous utilisez l'autochargement), mais la 
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declaration des sous-programmes aide le compilateur de differentes manieres et vous 
donne plus de choix dans votre facon de les appeler. 

La declaration d'un sous-programme lui permet d'etre utilise sans parentheses, comme 
s'il s'agissait d'un operateur integre depuis ce point de la compilation. (Nous avons uti- 
lise des parentheses pour appeler compte dans l'exemple precedent, mais en fait nous 
n'en avions pas besoin.) Vous pouvez declarer un sous-programme sans le definir juste 
en disant : 

sub monnom; 

$me = monnom $0 or die "Impossible de trouver mon nom"; 

Une declaration simple comme celle-ci declare la fonction comme un operateur de liste 
et non comme un operateur unaire, aussi faites attention a utiliser or et non | | dans ce 
cas. L'operateur | | lie trop fortement pour etre utilise apres des operateurs de liste, 
meme si vous pouvez toujours mettre des parentheses autour des arguments de l'opera- 
teur de liste pour le changer en appel de fonction. Autrement, vous pouvez utiliser le 
prototype ($) pour transformer la routine en operateur unaire : 

sub monnom ($); 

$me = monnom $0 | | die "Impossible de trouver mon nom"; 

C'est maintenant analyse comme vous vous y attendez, mais vous devriez tout de meme 
garder l'habitude d'utiliser or dans cette situation. Pour en savoir plus sur les prototy- 
pes, voir le chapitre 6, Sous-programmes. 

Vous devez definir le sous-programme a un moment donne, sinon vous obtiendrez une 
erreur a l'execution indiquant que vous avez appele un sous-programme indefini. A 
moins de definir le sous-programme vous-meme, vous pouvez recuperer les definitions 
depuis d'autres endroits de plusieurs facons. 

Vous pouvez charger les definitions depuis d'autres fichiers avec une simple instruction 
require ; c'etait la meilleure maniere de charger des fichiers en Perl 4, mais elle pose 
deux problemes. Premierement, l'autre fichier va typiquement inserer des noms de 
sous-programmes dans un paquetage (une table de symboles) de son choix, et non vos 
propres paquetages. Deuxiemement, un require se produit a l'execution et done arrive 
trop tard pour servir de declaration dans le fichier invoquant le require. II arrive cepen- 
dant que vous cherchiez justement a retarder le chargement. 

Une maniere plus utile de charger les declarations et les definitions est la declaration 
use, qui fait un require du module a la compilation (car use compte comme un bloc 
BEGIN) et vous laisse importer une partie des declarations du module dans votre propre 
programme. On peut done considerer use comme une declaration globale en ce qu'elle 
importe les noms a la compilation dans votre propre paquetage (global) comme si vous 
les aviez declares vous-meme. Voir la section Tables de symboles, au chapitre 10, Paqueta- 
ges, au sujet du fonctionnement bas niveau de l'importation entre paquetages, le chapi- 
tre 11, Modules, pour savoir comment configurer les parametres d'importation et 
d'exportation des modules, et le chapitre 18 pour une explication de BEGIN et de ses cou- 
sins CHECK, INIT et END, qui sont aussi des sortes de declarations globales puisqu'elles 
sont traitees a la compilation et peuvent avoir un effet global. 
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Declarations avec portee 

Comme les declarations globales, les declarations a portee lexicale ont un effet au mo- 
ment de la compilation. Contrairement aux declarations globales, les declarations a por- 
tee lexicale ne s'appliquent que du point de declaration jusqu'a la fin du bloc encadrant 
le plus interne (le premier bloc, fichier ou eval trouve). C'est pourquoi nous les appe- 
lons a portee lexicale, bien que le terme « portee textuelle » soit peut-etre plus exact, 
puisque la portee lexicale n'a rien a voir avec les lexiques. Mais les informaticiens du 
monde entier savent ce que signifie « portee lexicale », aussi perpetuons-nous cet usage 
ici. 

Perl supporte aussi les declarations a portee dynamique. Une portee dynamique s'etend 
aussi jusqu'a la fin du bloc encadrant le plus interne, mais « encadrant » dans ce cas est 
defini dynamiquement a l'execution, plutot que textuellement a la compilation. Pour 
le dire autrement, les bloc s'emboitent dynamiquement en invoquant d'autres blocs, 
pas en les incluant. Cet emboitement de portees dynamiques peut etre correle en quel- 
que sorte a l'emboitement des portees lexicales, mais les deux sont en general differents, 
particulierement quand des sous-programmes ont ete invoques. 

Nous avons mentionne que certains aspects de use pouvaient etre considered comme 
des declarations globales, mais d'autres aspects de use sont a portee lexicale. En particu- 
lier, use n'importe pas seulement les symboles, mais implemente egalement diverses di- 
rectives de compilation magiques, connues sous le nom de pragmas (ou si vous preferez 
la forme classique, pragmata). La plupart des pragmas sont a portee lexicale, y compris 
le pragma use strict 'vars' qui vous oblige a declarer vos variables avant de vous en 
servir. Voir plus loin la section Pragmas. 

Une declaration package, curieusement, est elle-meme a portee lexicale, malgre le fait 
qu'un paquetage est une entite globale. Mais une declaration package se contente de de- 
clarer l'identite du paquetage par defaut pour le reste du bloc l'encadrant. Les noms de 
variables non declares, non qualifies 6 sont recherches dans ce paquetage. En un sens, un 
paquetage n'est jamais declare du tout, mais il se met a exister quand vous faites referen- 
ce a quelque chose qui appartient a ce paquetage. C'est tres Perlien. 

Declarations de variables a portee limitee 

Le reste de ce chapitre parle surtout de l'utilisation de variables globales. Ou plutot, par- 
le de la non utilisation de variables globales. II existe plusieurs declarations qui vous 
aident a ne pas utiliser de variables globales — ou au moins a ne pas les utiliser bete- 
ment. 

Nous avons deja mentionne la declaration package, qui a ete introduite en Perl il y a 
bien longtemps pour pouvoir separer les variables globales en paquetages separes. Cela 
marche assez bien pour un certain type de variables. Les paquetages sont utilises par des 
bibliotheques, des modules et des classes pour stacker leurs donnees d'interface (et cer- 
taines de leur donnees semi-privees) pour eviter les conf lits avec des variables et des 



6. Et aussi les noms de sous-programmes, handles de fichiers, handles de repertoires et formats 
non qualifies. 
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fonctions de meme nom dans votre programme principal ou dans d'autres modules. Si 
vous voyez quelqu'un ecire $0uelque : : chose, 7 il se sert de la variable scalaire $chose du 
paquetage Quelque. Voir le chapitre 10. 

Si c'etait tout ce qu'il existait en la matiere, les programmes Perl deviendraient de plus 
en plus difficiles a manipuler en grossissant. Heureusement, les trois declarations de 
portee de Perl permettent de creer facilement des variables completement privees (avec 
my), de donner selectivement Faeces aux globales (avec our) et de donner des valeurs 
temporaires a des variables globales (avec local). 

my $nose; 

our $House; 

local $TV_channel; 

Si plusieurs variables sont listees, la liste doit etre placee entre parentheses. Pour my et 
our, les elements ne peuvent etre que de simples scalaires, tableaux ou hachages. Pour 
local, les contraintes sont quelque peu relachees : vous pouvez egalement localiser des 
typeglobs en entier ou de simples elements, ou des tranches de tableaux ou de 
hachages : 

my ($nose, iSeyes, %teeth); 
our ($House, (SAutos, %Kids); 
local (*Spouse, $phone{H0ME}); 

Chacun de ces modificateurs propose une sorte d'isolation differente aux variables qu'il 
modifie. Pour simplifier legerement : our confine les noms a une portee, local confine 
les valeurs a une portee, et my confine a la fois les noms et les valeurs a une portee. 

Ces constructions peuvent se voir affecter des valeurs, mais different en ce qu'elles font 
reellement avec ces valeurs, puisqu'elles proposent des mecanismes differents de stocka- 
ge des valeurs. Elles sont aussi quelque peu differentes quand vous ne leur affectez aucu- 
ne valeur (comme dans notre exemple ci-dessus) : my et local font demarrer les variables 
en question a la valeur undef ou () appropriee selon le contexte ; our au contraire ne 
modifie pas la valeur de la variable globale associee. 

Syntaxiquement, my, our et local sont simplement des modificateurs (comme des ad- 
jectifs) agissant sur une lvalue. Quand vous affectez a une lvalue modifiee, le modifica- 
teur ne change pas le fait que la lvalue soit vue comme un scalaire ou une liste. Pour 
savoir comment le modificateur va fonctionner, faites comme s'il n'etait pas la. Ces deux 
constructions fournissent done un contexte de liste du cote droit : 

my ($toto) = <STDIN>; 
my @tableau = <STDIN>; 

Tandis que celle-ci fournit un contexte scalaire : 

my $toto = <STDIN>; 

Les modificateurs lient plus fort (avec une precedence superieure) que l'operateur vir- 
gule. L'exemple suivant ne declare qu'une variable au lieu de deux, car la liste qui suit 
le modificateur n'est pas entre parentheses. 



7. Ou l'archai'que $0uelque' chose qui ne devrait probablement pas etre encourage en dehors de 
la poesie Perl. 
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my $toto, $titi =1; # FAUX 

Cela a le meme effet que : 

my $toto; 
$titi = l; 

Vous serez averti de cette erreur si vous avez demande les avertissements, avec les op- 
tions de ligne de commande -w ou -W, ou de preference avec la declaration use warnings 
expliquee plus loin dans la section Pragmas. 

En general, il vaut mieux declarer une variable dans la plus petite portee necessaire. 
Comme les variables declarees dans des instructions de controle de flux ne sont visibles 
que dans le bloc concerne par cette instruction, leur visibilite est reduite. Cela se lit ega- 
lement mieux en anglais (ce qui a moins d'interet pour ceux qui codent en francais). 

sub verif iestock { 

for my $machin (our @Inventaire) { 

print "D'ai un $machin en stock aujourd'hui. \n"; 

} 

} 

La forme de declaration la plus frequente est my, qui declare des variables a portee lexi- 
cale dont le nom et la valeur sont stockes dans le bloc-note temporaire de la portee en 
cours et ne peuvent etre accedes de maniere globale. La declaration our est tres proche 
de cela, et fait entrer un nom lexical dans la portee en cours, tout comme my, mais pointe 
en realite vers une variable globale a laquelle n'importe qui pourrait acceder s'il le vou- 
lait. En d'autres termes, c'est une variable globale maquillee en variable lexicale. 

L'autre forme de portee, la portee dynamique, s'applique aux variables declarees avec 
local, qui malgre l'emploi du mot « local » sont en fait des variables globales qui n'ont 
rien a voir avec le bloc-notes local. 

Variables a portee lexicale : my 

Pour vous eviter le casse-tete du suivi des variables globales, Perl fournit des variables a 
portee lexicale, appelees parfois lexicales pour faire court. Contrairement aux globales, 
les lexicales vous garantissent le secret de vos variables. Tant que vous ne distribuez pas 
des references a ces variables privees qui permettraient de les tripatouiller indirecte- 
ment, vous pouvez etre sur que tous les acces possibles a ces variables privees sont res- 
treints au code contenu dans une section limitee et aisement identifiable de de votre 
programme. Apres tout, c'est la raison pour laquelle nous avons choisi le mot-cle my. 

Une sequence d'instructions peut contenir des declarations de variables a portee lexica- 
le. De telles declarations sont habituellement placees au debut de la sequence d'instruc- 
tions, mais ce n'est pas une obligation. En plus de declarer les noms de variables a la 
compilation, les declarations fonctionnent comme des instructions normales a l'execu- 
tion : chacune d'entre elles est elaboree dans la sequence d'instructions comme s'il 
s'agissait d'une instruction usuelle sans le modificateur : 

my $nom = "fred"; 

my @affaires = ("voiture", "maison", "marteau"); 
my ($vehicule, $domicile, $outil) = @affaires; 

Ces variables lexicales sont totalement cachees du monde a l'exterieur de la portee les 
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contenant immediatement. Contrairement aux effets de portee dynamique de local 
(voir la section suivante), les lexicales sont cachees a tout sous-programme appele depuis 
leur portee. Cela reste vrai meme si le meme sous-programme est appele depuis lui- 
meme ou ailleurs — chaque instance du sous-programme possede son propre « bloc- 
notes » de variables lexicales. 

Contrairement aux portees de blocs, les portees de fichiers ne s'emboitent pas ; il ne se 
produit pas d'« inclusion », tout au moins pas textuellement. Si vous chargez du code 
d'un autre fichier avec do, require ou use, le code contenu dans ce fichier ne pourra pas 
acceder a vos variables lexicales, tout comme vous ne pourrez pas acceder aux siennes. 

Cependant toute portee a l'interieur d'un fichier (ou meme le fichier lui-meme) fait 
l'affaire. II est souvent utile d'avoir des portees plus larges que la definition de sous-pro- 
gramme, car cela vous permet de de partager des variables privees avec un nombre limi- 
te de routines. C'est ainsi que vous creez des variables qu'un programmeur C appellerait 
« statiques » : 

{ 

my $etat = 0; 

sub on { $etat = 1 } 
sub off { $etat = 0 } 
sub change { $etat = !$etat } 

} 

L'operateur eval CHAINE fonctionne aussi comme une portee emboitee, puisque le code 
a l'interieur de l'eval peut voir les variables lexicales de l'appelant (tant que leurs noms 
ne sont pas caches par des declarations identiques dans la portee definie par l'eval lui- 
meme). Les routines anonymes peuvent de meme acceder a n'importe quelle variable 
lexicale des portees les renfermant ; si elles le font, elles sont alors nominees fermetures. 8. 
En combinant ces deux notions, si un bloc evalue une chaine qui cree un sous-program- 
me anonyme, ce sous-programme devient une fermeture avec acces complet aux lexica- 
les de l'evalet du bloc, meme apres que le l'eval et le bloc se sont termines. Voir la 
section Fermetures au chapitre 8. 

La variable nouvellement declaree (ou la valeur, dans le cas de local) n'apparait pas 
avant la fin de Finstruction suivant l'instruction contenant la declaration. Vous pourriez 
done copier une variable de cette facon : 

my $x = $x; 

Cela initialise le nouveau $x interne avec la valeur courante de $x, que la signification 
de $x soit globale ou lexicale. (Si vous n'initialisez pas la nouvelle variable, elle demarre 
avec une valeur vide ou indefinie.) 

La declaration d'une variable lexicale d'un nom donne cache toute variable lexicale du 
meme nom declaree precedemment. Elle cache aussi toute variable globale non quali- 
fiee du meme nom, mais celle-ci reste toujours accessible en la qualifiant explicitement 
avec le nom du paquetage la contenant, par exemple $NomPaquetage: : nomvar. 



8. La veritable definition de la fermeture vient d'une notion mathematique concernant la com- 
pletude d'ensembles de valeurs et des operateurs sur ces valeurs. 
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Declarations de globales a portee lexicale : our 

La declaration our est une meilleure maniere d'acceder aux globales, en particulier pour 
les programmes et les modules tournant avec la declaration use strict. Cette declara- 
tion est a portee lexicale dans le sens oil elle ne s'applique que jusqu'a la fin de la portee 
courante. Mais contrairement au my a portee lexicale ou au local a portee dynamique, 
our n'isole rien dans la portee lexicale ou dynamique en cours. En fait, il donne acces a 
une variable globale dans le paquetage en cours, en cachant les lexicales de mime nom 
qui vous auraient sinon empeche de voir cette globale. A cet egard, nos variables our 
fonctionnent tout comme mes variables my. 

Si vous placez une declaration our en dehors de tout bloc delimite par des accolades, elle 
dure jusqu'a la fin de l'unite de compilation en cours. Souvent, on la place juste au de- 
but de la definition d'un sous-programme pour indiquer qu'il accede a une variable glo- 
bale : 

sub verif ieentrepot { 

our @Inventaire_Courant; 
my $machin; 

foreach $machin (@Inventaire_Courant) { 

print "D'ai un $machin en stock aujourd'hui. \n"; 

} 

} 

Comme les variables globales ont une duree de vie plus longue et une visibilite plus lar- 
ge que les variables privees, nous preferons utiliser pour elles des noms plus longs et 
plus voyants que pour les variables temporaires. Cette simple habitude, si elle est suivie 
consciencieusement, peut faire autant que use strict pour decourager l'emploi de va- 
riables globales, particulierement chez ceux qui ne sont pas des virtuoses du clavier. 

Des declarations our repetees ne s'emboitent pas clairement. Chaque my emboite pro- 
duit une nouvelle variable, et chaque local emboite produit une nouvelle valeur. Mais 
a chaque fois que vous employez our, vous mentionnez la meme variable globale, sans 
notion d'emboitement. Quand vous affectez a une variable our, les effets de cette affec- 
tation persistent une fois hors de portee de la declaration. C'est parce que our ne cree 
jamais de valeur ; il donne seulement une forme d'acces limite a la globale qui, elle, exis- 
te pour toujours : 

our $N0M_PR0GRAMME = "client"; 
{ 

our $N0M_PR0GRAMME = "serveur"; 

# Le code appele d'ici voit "serveur". 

} 

# Le code execute ici voit toujours "serveur". 

Comparez ceci avec ce qui arrive avec my ou local, quand la variable ou la valeur rede- 
vient visible apres le bloc : 

my $i = 10; 
{ 

my $i = 99; 



} 
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# Le code compile ici voit la variable externe. 

local $N0M_PR0GRAMME = "client"; 
{ 

local $N0M_PR0GRAMME = "serveur"; 

# Le code appele d'ici voit "serveur". 

} 

# Le code execute ici voit "client" de nouveau. 

Faire une declaration our n'a en general de sens qu'une seule fois, probablement tout 
au debut de votre programme ou module ou, plus rarement, quand vous prefixez le our 
de son propre local : 

{ 

local our §Inventaire_Courant = qw(bananes); 
verifie_entrepot(); # non, nous n'avons pas de bananes :-) 

} 

Variables a portee dynamique : local 

L'utilisation de l'operateur local sur une variable globale lui donne une valeur tempo- 
raire a chaque fois que local est execute, mais n'affecte pas la visibilite globale de cette 
variable. Quand le programme atteint la fin de cette portee dynamique, cette valeur tem- 
poraire est jetee et la valeur precedente restauree. Mais pendant que ce bloc s'execute, 
c'est toujours une variable globale qui se trouve juste contenir une valeur temporaire. Si 
vous appelez une autre fonction pendant que votre variable globale contient la valeur 
temporaire et que cette fonction accede a cette variable globale, elle verra la valeur tem- 
poraire et pas la valeur initiale. En d'autres termes, cette autre fonction est dans votre 
portee dynamique, meme si elle n'est probablement pas dans votre portee lexicale. 9 

Si vous avez un local qui ressemble a ceci : 
{ 

local $var = $nouveau; 
ma_fonction(); 

} 

vous pouvez le voir entierement en termes d'affectations a l'execution : 
{ 

$ancien = $var; 

local $var = $nouveau; 

ma_fonction(); 

} 



9. C'est pourquoi on appelle parfois la portee lexicale une portee statique : pour contraster avec 
la portee dynamique et insister sur le fait qu'elle est determined a la compilation. Ne confondez 
pas cette utilisation avec l'emploi du mot-cle static en C ou en C++. Le terme est tres charge, 
c'est pourquoi nous l'evitons. 
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continue { 

$var = $ancien; 

} 

La difference est qu'avec local, la valeur est restauree quelle que soit la maniere dont 
vous quittez le bloc, meme si vous sortez de cette portee en faisant un returnpremature. 
La variable est toujours la meme variable globale, mais la valeur qui s'y trouve depend 
de la portee d'ou la fonction a ete appelee. C'est pourquoi on l'appelle portee dynamique : 
parce qu'elle change au cours de l'execution. 

Comme avec my, vous pouvez initialiser un local avec une copie de la meme variable 
globale. Toutes les modifications faites a cette variable pendant l'execution du sous-pro- 
gramme (et de tous les autres appeles depuis celui-ci, qui peuvent bien star voir cette glo- 
bale a portee dynamique) seront perdues quand la routine se terminera. Vous devriez 
surement commenter ce que vous faites : 

# ATTENTION : les modifications sont temporaires 

# pour cette portee dynamique 
local $Ma_Globale = $Ma_Globale; 

Une variable globale est done toujours visible dans l'integralite de votre programme, 
qu'elle ait ete declaree avec our, qu'elle ait ete creee a la volee ou qu'elle contienne une 
valeur locale destinee a etre jetee une fois hors de portee. Ce n'est pas complique pour 
de petits programmes. Mais vous allez rapidement ne plus retrouver oil sont utilisees 
ces variables globales dans de plus gros programmes. Si vous voulez, vous pouvez inter- 
dire l'utilisation accidentelle de variables globales a l'aide du pragma use strict 
'vars', decrit a la section suivante. 

Bien que my et local conferent toutes deux un certain niveau de protection, vous de- 
vriez largement preferer my a local. Cependant, vous devrez de temps en temps utiliser 
localpour pouvoir modifier temporairement la valeur d'une variable globale existan- 
te, comme celles decrites au chapitre 28, Noms spe'eiaux. Seuls les identificateurs alpha- 
numeriques peuvent avoir une portee lexicale et beaucoup de ces variables speciales ne 
sont pas strictement alphanumeriques. Vous aurez aussi besoin de local pour faire des 
modifications temporaires a la table des symboles d'un paquetage, comme c'est decrit 
dans la section Tables de symboles au chapitre 10. Enfin, vous pouvez aussi utiliser local 
sur un element isole ou tout une tranche d'un tableau ou d'un hachage. Cela fonction- 
ne meme si le tableau ou le hachage est en fait une variable lexicale, en rajoutant la cou- 
che de comportement de portee dynamique de local au dessus de ces variables 
lexicales. Nous ne parlerons pas plus de la semantique de local ici. Pour plus d'infor- 
mations, voir local au chapitre 29. 

Pragmas 

De nombreux langages de programmation vous permettent de donner des directives au 
compilateur. En Perl ces directives sont passees au compilateur par la declaration use. 
Certains de ces pragmas sont : 

use warnings; 

use strict; 

use integer; 

use bytes; 

use constant pi => ( 4 * atan2(l,l) ); 
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Les pragmas de Perl sont decrits au chapitre 31, Modules de pragmas, mais nous allons 
tout de suite parler des plus utiles par rapport au contenu de ce chapitre. 

Bien que certains soient des declarations qui affectent les variables globales ou le paque- 
tage en cours, la plupart des pragmas sont des declarations a portee lexicale dont les ef- 
fets ne durent que jusqu'a la fin du bloc, du fichier ou de l'eval qui les contient (en 
fonction du premier qui se presente). Un pragma a portee lexicale peut etre annule dans 
une portee incluse avec une declaration no, qui fonctionne exactement comme use, 
mais a l'envers. 

Controle des avertissements 

Pour vous montrer comment tout cela fonctionne, nous allons manipuler le pragma 
warnings pour dire a Perl s'il doit nous avertir de pratiques discutables : 

use warnings; # Permet les avertissements cFici a la fin de fichier 

{" 

no warnings; # Desactive les avertissements dans le bloc 

} 

# Les avertissements sont automatiquement reactives ici 

Une fois les avertissements demandes, Perl vous signalera les variables utilisees une seu- 
le fois, les declarations qui cachent d'autres declarations dans la meme portee, les con- 
versions incorrectes de chaines en nombres, l'utilisation de valeurs indefinies comme 
des nombres ou des chaines normaux, les tentatives d'ecriture sur des fichiers ouverts 
en lecture seule (ou pas ouverts du tout) et bien d'autres problemes potentiels listes au 
chapitre 33, Messages de diagnostic. 

La methode de controle des avertissements recommandee est l'utilisation de use warn- 
ings. Les anciens programmes ne pouvaient utiliser que l'option de ligne de commande 
-w ou bien modifier la variable globale $ A W : 

{ 

local $ A W = 0; 

} 

II vaut beaucoup mieux utiliser les pragmas use warnings et no warnings. Un pragma 
vaut mieux car il se produit a la compilation, parce que c'est une declaration lexicale et 
ne peut done pas affecter du code qu'il n'etait pas cense affecter, et (bien que nous ne 
vous l'ayons pas montre dans ces simples exemples) qu'il permet un controle plus fin 
sur plusieurs ensembles de classes. Pour en savoir plus sur le pragma warnings, y com- 
pris comment transformer des avertissements qui font juste un peu de bruit en erreurs 
fatales et comment supplanter le pragma pour activer les avertissements meme si le mo- 
dule ne veut pas, voir use warnings au chapitre 31. 

Controle de rutilisation des globales 

Une autre declaration communement rencontree est le pragma use strict, qui a plu- 
sieurs fonctions dont celle de controler l'utilisation des variables globales. Normale- 
ment, Perl vous laisse creer de nouvelles variables (ou trop souvent, ecraser d'anciennes 
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variables) simplement en les citant. Aucune declaration de variable n'est necessaire (par 
defaut). Sachant que Futilisation debridee de globales peut rendre les gros programmes 
ou les gros modules penibles a maintenir, vous pourrez vouloir decourager leur utilisa- 
tion accidentelle. Pour prevenir de tels accidents, vous pouvez ecrire : 

use strict 'vars'; 

Cela signifie que toute variable mentionnee a partir d'ici jusqu'a la fin de la portee cou- 
rante doit faire reference soit a une variable lexicale, soit a une variable globale explici- 
tement autorisee. Si ce n'est pas le cas, une erreur de compilation se produit. Une 
variable globale est explicitement autorisee si l'une de ces propositions est vraie : 

• C'est l'une des variables speciales de Perl (voir le chapitre 28). 

• Elle est completement definie avec son nom de paquetage (voir le chapitre 10). 

• Elle a ete importee dans le paquetage courant (voir le chapitre 11). 

• Elle se fait passer pour une variable lexicale a l'aide d'une declaration our. (C'est la 
raison principale pour laquelle nous avons ajoute la declaration our a Perl.) 

Bien sur, il reste toujours la cinquieme possibilite. Si le pragma est trop exigeant, annu- 
lez-le simplement dans un bloc intereur avec : 

no strict 'vars' 

Avec ce pragma vous pouvez aussi demander une verification stricte des dereference- 
ments symboliques et de futilisation des mot simples. Habituellement, les gens tapent 
juste : 

use strict; 

pour mettre en oeuvre les trois restrictions. Pour plus d'informations, voir l'entree use 
strict, au chapitre 31. 



5 

Recherche de motif 



Le support integre de Perl pour la recherche de motif vous permet de rechercher dans 
de grandes quantites de donnees simplement et efficacement. Que vous fassiez tourner 
un enorme site portail commercial balayant tous les groupes de news existants a la re- 
cherche de potins interessants, un organisme public occupe a comprendre la demogra- 
phie humaine (ou le genome humain), une institution scolaire desireuse de mettre des 
informations dynamiques sur votre site web, Perl est Foutil qu'il vous faut ; d'une part 
a cause de ses liens avec les bases de donnees, mais surtout a cause de ses capacites de 
recherche de motif Si vous prenez le mot « texte » dans son sens le plus large, pres de 
90% de tout ce vous faites est du traitement de texte. C'est vraiment ce pour quoi Perl 
est fait et a toujours ete fait — en fait, cela fait meme partie de son nom : Practical Ex- 
traction and Report Language. Les motifs de Perl fournissent de puissants moyens pour 
ratisser des montagnes de donnees brutes et en extraire de l'information utile. 

Vous specifiez un motif en creant une expression rationnelle (ou expression reguliere 1 ou 
regex) et le moteur d'expressions regulieres de Perl (le « Moteur », pour le reste de ce 
chapitre) prend cette expression et determine si (et comment) le motif correspond a vos 
donnees. Alors que la plupart de vos donnees seront probablement des chames de ca- 
racteres, rien ne vous empeche de vous servir des regex pour rechercher et remplacer 
n'importe quelle sequence de bits, y compris ce que vous auriez cru etre des donnees 
« binaires ». Pour Perl, les octets sont juste des caracteres qui ont une valeur ordinale 
inferieure a 256. (Pour en savoir plus sur ce sujet, voir le chapitre 15, Unicode.) 

Si vous connaissiez deja les expressions regulieres avec d'autres outils, nous devons vous 
prevenir que celles de Perl sont un peu differentes. Premierement elles ne sont pas vrai- 
ment « regulieres » (ou « rationnelles ») au sens theorique du mot, ce qui signifie 
qu'elles peuvent faire beaucoup plus que les expressions rationnelles qu'on apprend en 



1. NdT : Regular expression a deux traductions en francais : « expression rationnelle », qui est un 
terme plutot academique, et « expression reguliere », qui ressemble fort au terme utilise par les 
anglophones. Dans ce livre nous utiliserons plutot le second (et son abreviation anglaise 
« regex »), mais il est possible qu'un peu de rationalite se glisse ici ou la... 
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cours d'informatique. Deuxiemement, dies sont tellement utilisees en Perl, qu'elles ont 
leurs propres variables speciales et leur propres conventions de citation qui sont etroi- 
tement integrees au langage, pas vaguement liees comme n'importe quelle autre librai- 
rie. Les nouveaux programmeurs Perl cherchent souvent en vain des fonctions comme : 

match( $chaine, $motif ); 

subst( $chaine, $motif, $remplacement ); 

Mais la recherche et la substitution sont deux taches si fondamentales en Perl qu'elle 
meritent leurs propres operateurs d'une lettre : m/MOTIF/ et s/MOTIF/REMPLACEMENT/. lis 
sont non seulement brefs syntaxiquement, mais ils sont aussi analyses comme des chai- 
nes entre apostrophes doubles plutot que comme des operateurs ordinaires ; toutefois, 
ils fonctionnent comme des operateurs, c'est pourquoi nous les appelons ainsi. Tout au 
long de ce chapitre, vous les verrez utilises pour comparer des motifs a des chaines. Si 
une partie de la chaine correspond au motif, nous disons que la correspondance (ou re- 
cherche) est reussie. II y a plein de trues sympas a faire avec des correspondances reus- 
sies. En particulier, si vous utilisez s///, une correspondance reussie provoque le 
remplacement de la partie correspondante dans la chaine parce que vous avez specifie 
comme REMPLACEMENT. 

Tout ce chapitre concerne la construction et l'utilisation de motifs. Les expressions re- 
gulieres de Perl sont puissantes, et concentrent beaucoup de sens en peu de volume. El- 
les peuvent done vous intimider si vous essayez de saisir le sens d'un long motif d'un 
seul coup. Mais si vous pouvez le decouper en petits morceaux et que vous savez com- 
ment le Moteur interprete ces morceaux, vous pouvez comprendre n'importe quelle ex- 
pression reguliere. II n'est pas rare de voir une centaine de lignes de code C ou Java 
exprimees en une expression reguliere d'une ligne en Perl. Cette expression reguliere est 
peut-etre un peu plus difficile a comprendre que n'importe quelle ligne du gros pro- 
gramme ; d'un autre cote, la regex sera beaucoup plus facile a comprendre que le plus 
long programme pris dans son ensemble. II vous faut juste garder tout cela en perspec- 
tive. 

Bestiaire des expressions regulieres 

Avant de nous plonger dans les regies d'interpretation des expressions regulieres, regar- 
dons a quoi certains motifs ressemblent. La plupart des caracteres d'une expression re- 
guliere se correspondent a eux-memes. Si vous enchainez plusieurs caracteres a la suite, 
ils se correspondent dans l'ordre, comme on s'y attend. Done si vous ecrivez la recherche 
suivante : 

/Frodon/ 

vous pouvez etre sur que le motif ne correspondra que si la chaine contient quelque part 
la sous-chaine « Frodon ». (Une sous-chaine est juste un morceau de chaine.) La corres- 
pondance peut se faire n'importe oil dans la chaine, tant que ces six caracteres apparais- 
sent quelque part, Fun apres l'autre et dans cet ordre. 

D'autres caracteres ne se correspondent pas a eux-memes, mais se comportent d'une 
etrange maniere. Nous les appelons metacaracteres. (Tous les metacaracteres sont des co- 
quins, mais certains sont si mauvais, qu'ils conduisent les caracteres voisins a se compor- 
ter aussi mal qu'eux.) 
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Void les scelerats : 

\ | ( ) [ { A $ * + ? . 

Les metacaracteres sont en fait tres utiles et ont une signification speciale a l'interieur 
des motifs. Nous vous expliquerons toutes ces significations au fur et a mesure de ce cha- 
pitre. Mais sachez d'abord que vous pourrez toujours detecter n'importe lequel de ces 
douze caracteres en le faisant preceder d'un antislash. Par exemple, comme l'antislash 
est un metacaractere, pour detecter un antislash, vous devrez Fantislasher : \\. 

Vous voyez, l'antislash est le genre de caractere qui pousse les autres caracteres a mal se 
conduire. Finalement, quand vous faites mal se conduire un metacaractere indiscipline, 
il se conduit bien — un peu comme une double negation. Antislasher un caractere pour 
le prendre litteralement marche, mais seulement sur les caracteres de ponctuation ; an- 
tislasher un caractere alphanumerique (qui habituellement se comporte correctement) 
fait le contraire : cela transforme le caractere litteral en quelque chose de special. Des 
que vous voyez une telle sequence de deux caracteres : 

\b \D \t \3 \s 

vous saurez que la sequence est un me'tasymbole qui correspond a quelque chose d'etran- 
ge. Par exemple, \b correspond a une limite de mot, tandis que \t correspond a un ca- 
ractere de tabulation ordinaire. Remarquez qu'une tabulation fait un caractere de large, 
alors que la limite de mot a une largeur de zero caractere, puisque c'est un point entre 
deux caracteres. Nous appellerons done \b une assertion de largeur nulle. Cependant, \t 
et \b se ressemblent en ce qu'ils supposent quelque chose sur une caracteristique de la 
chaine. A chaque fois que vous faites une assertion au sujet de quelque chose dans une 
expression reguliere, vous demandez a ce que quelque chose en particulier soit vrai 
pour que le motif corresponde. 

La plupart des elements d'une expression reguliere sont des assertions, y compris les ca- 
racteres ordinaires qui veulent se correspondre a eux-memes. Pour etre plus precis, ils 
supposent aussi que le prochain element sera en correspondance un caractere plus loin 
dans la chaine, c'est pourquoi nous disons que la tabulation est de « largeur un 
caractere ». Certaines assertions (comme \t) consomment un peu de la chaine au fur et 
a mesure qu'ils entrent en correspondance et d'autres (comme \b) non. Mais nous re- 
servons en general le terme « assertion » pour les assertions de largeur nulle. Pour evi- 
ter les confusions, nous appellerons celles qui ont une largeur des atomes. (Si vous etes 
physicien, vous pouvez voir les atomes de largeur non nulle comme des particules mas- 
sives, a la difference des assertions, qui n'ont pas de masse comme les photons.) 

Vous allez voir aussi des metacaracteres qui ne sont pas des assertions ; ils sont plutot 
structured (tout comme les accolades et les points-virgules definissent la structure du 
code Perl, mais ne font pas vraiment quelque chose). Ces metacaracteres structured sont 
d'une certaine maniere les plus importants, car le premier pas dans votre apprentissage 
de la lecture des expressions regulieres est d'habituer votre regard a reconnaitre les me- 
tacaracteres structured. Une fois que vous avez appris cela, lire des expressions regulieres 
est un jeu d'enfant 2 . 



2. D'enfant precoce parfois, mais pas besoin d'etre un futur Prix Nobel. 
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L'un de ces metacaracteres structured est la barre verticale, qui indique un choix : 

/Frodon | Pippin | Merry | Sam/ 

Cela signifie que n'importe laquelle de ces chames peut correspondre. Ceci est traite 
dans la section Alternative plus loin dans ce chapitre. Dans la partie Capture et regroupe- 
ment, nous vous montrerons comment utiliser les parentheses autour de morceaux de 
votre motif pour faire des regroupements : 

/(Frodon|Drogon|Bilbon) Sacquet/ 

ou meme : 

/(Frod|Drog|Bilb)on Sacquet/ 

Une autre chose que vous verrez sont les quantificateurs, qui disent combien de fois ce 
qui precede doit etre trouve a la queue-leu-leu. Les quantificateurs ressemblent a ceci : 

* + ? *? {3} {2,5} 

Vous ne les verrez cependant jamais isolement. Les quantificateurs n'ont de sens qu'at- 
taches a des atomes — c'est-a-dire a des assertions qui ont une largeur non nulle. 3 Les 
quantificateurs s'attachent a l'atome precedent seulement. Ce qui signifie en termes 
clairs qu'ils ne quantifient normalement qu'un seul caractere. Si vous voulez une cor- 
respondance avec trois copies de « bar » a la suite, vous devez regrouper les caracteres 
individuels de « bar » dans une seule « molecule » avec des parentheses, comme ceci : 

/(bar){3}/ 

Cela correspondra avec « barbarbar ». Si vous aviez ecrit /bar{3}/, cela aurait corres- 
pondu avec « barrr » — qui aurait sonne ecossais mais n'aurait pas constitue un barbar- 
barisme. Pour en savoir plus sur les quantificateurs, voir plus loin la section 
Quantificateurs. 

Maintenant que vous avez rencontre quelques-unes des bestioles qui habitent les expres- 
sions regulieres, vous etes surement impatient de commencer a les apprivoiser. Cepen- 
dant, avant que nous ne discutions serieusement des expressions regulieres, nous allons 
un petit peu rebrousser chemin et parler des operateurs qui utilisent les expressions re- 
gulieres. (Et si vous apercevez quelques nouvelles bestioles regex en chemin, n'oubliez 
pas le guide.) 

Operateurs de recherche de motifs 

Zoologiquement parlant, les operateurs de recherche de motif de Perl fonctionnent 
comme une sorte de cage a expressions regulieres : ils les empechent de sortir. Si nous 
laissions les regex errer en liberte dans le langage, Perl serait une jungle complete. Le 
monde a besoin de jungles bien sur — apres tout, ce sont les moteurs de la diversite 
biologique — mais les jungles devraient rester oil elles sont. De meme, bien qu'etant le 



3. Les quantificateurs sont un peu comme les modificateurs destructions du chapitre 4, Ins- 
tructions et declarations, qui ne peuvent s'attacher qu'a une instruction simple. Attacher un quan- 
tificateur a une assertion de largeur nulle, cela reviendrait a essayer d'attacher un modificateur 
while a une declaration — ces deux actions etant aussi sensees que de demander a un chimiste 
une livre de photons. Les chimistes ne travaillent qu'avec des atomes. 
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moteur de la diversite combinatoire, les expressions regulieres devraient rester a Finte- 
rieur des operateurs de recherche de motifs oil est leur place. C'est une jungle, la-dedans. 

Comme si les expressions regulieres n'etaient pas assez puissantes, les operateurs mil et 
si 1 1 leur donnent le pouvoir (lui aussi confine) de Finterpolation entre apostrophes 
doubles. Comme les motifs sont analyses comme des chaines entre apostrophes dou- 
bles, toutes les conventions usuelles des apostrophes doubles fonctionnent, y compris 
Finterpolation de variables (a moins que vous n'utilisiez les apostrophes simples com- 
me delimiteurs) et les caracteres speciaux indiques par des sequences d'echappement 
avec antislash. (Voir Caracteres specifiques plus loin dans ce chapitre.) Celles-ci sont ap- 
pliquees avant que la chaine soit interpretee comme une expression reguliere. (C'est 
Fun des quelques endroits de Perl oil une chaine subit un traitement en plusieurs pas- 
ses.) La premiere passe n'est pas une interpretation entre apostrophes doubles tout a fait 
normale, en ce qu'elle sait ce qu'elle doit interpoler et ce qu'elle doit passer a Fanalyseur 
d'expressions regulieres. Done par exemple, tout $ immediatement suivi d'une barre 
verticale, d'une parenthese fermante ou de la fin de chame ne sera pas traite comme une 
interpolation de variable, mais comme la traditionnelle assertion de regex qui signifie 
fin-de-ligne. Done si vous ecrivez : 

$toto = "titi"; 
/$toto$/; 

la passe d'interpolation entre apostrophes doubles sait que ces deux $ fonctionnent dif- 
feremment. Elle fait Finterpolation de $toto puis envoie ceci a Fanalyseur d'expressions 
regulieres : 

/titi$/; 

Une autre consequence de cette analyse en deux passes est que le tokener ordinaire de 
Perl trouve la fin de l'expression reguliere en premier, tout comme s'il cherchait le de- 
limiteur final d'une chaine ordinaire. C'est seulement apres avoir trouve la fin de la 
chaine (et fait les interpolations de variables) que le motif est traite comme une expres- 
sion reguliere. Entre autres choses, cela signifie que vous ne pouvez pas « cacher » le de- 
limiteur final d'un motif a Finterieur d'un element de regex (comme une classe de 
caracteres ou un commentaire de regex, que nous n'avons pas encore couvert). Perl verra 
le delimiteur oil qu'il se trouve et terminera le motif a cet endroit. 

Vous devez egalement savoir que Finterpolation de variables dans un motif ralentit 
Fanalyseur de motif, car il se sent oblige de verifier si la variable a ete modifiee, au cas 
ou il aurait a recompiler le motif (ce qui le ralentira encore plus). Voir la section Inter- 
polation de variables plus loin dans ce chapitre. 

L'operateur de transliteration tr/// ne fait pas d'interpolation de variables ; il n'utilise 
meme pas d'expressions regulieres ! (En fait, il ne devrait probablement pas faire partie 
de ce chapitre, mais nous n'avons pas trouve de meilleur endroit ou le mettre.) Il a ce- 
pendant une caracteristique commune avec mil et sill : il se lie aux variables grace aux 
operateurs =~ et ! ~. 

Les operateurs =~ et ! ~, decrits au chapitre 3, Operateurs unaires et binaires, lient l'expres- 
sion scalaire a leur gauche a Fun des trois operateurs de type apostrophes (ou guille- 
mets) a leur droite : ml I pour rechercher un motif, si 1 1 pour substituer une chaine a 
une sous-chaine correspondant au motif et tr/// (ou son synonyme, y///) pour tradui- 
re un ensemble de caracteres en un autre ensemble de caracteres. (Vous pouvez ecrire 
// pour mil sans le m si les slash sont utilises comme delimiteurs.) Si la partie a droite 
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de =~ ou !~ n'est aucune de ces trois la, die compte toujours comme une operation mill 
de recherche, mais il n'y a pas la place de mettre un seul modificateur final (voir plus 
loin la section Modificateurs de motif) et vous devrez gerer vos propres apostrophes : 

print "correspond" if $unechaine =~ $unmotif; 

Vraiment, il n'y a pas de raison de ne pas l'ecrire explicitement : 

print "correspond" if $unechaine =~ m/$unmotif/; 

Quand ils sont utilises pour une recherche de correspondance, =~ et ! ~ se prononcent 
parfois respectivement « correspond a » et « ne correspond pas a » (bien que 
« contient » et « ne contient pas » puissent etre plus clair). 

Hormis les operateurs mil et s///, les expressions regulieres apparaissent a deux autres 
endroits dans Perl. Le premier argument de la fonction splitest une forme speciale de 
Foperateur de correspondance specifiant les parties a ne pas retourner quand on decou- 
pe une chame en plusieurs sous-chames. Voir la description de split et les exemples au 
chapitre 29, Fonctions. L'operateur qr// (quote regex) specifie egalement un motif a l'aide 
d'une regex, mais il n'essaie pas de faire une correspondance avec quoi que ce soit (con- 
trairement a mil, qui le fait). Au lieu de cela, il retourne une forme compilee de la regex 
pour une utilisation ulterieure. Voir Interpolation de variables pour plus d'informations. 

Vous appliquez l'un des operateurs mil, sill ou til 1 1 a une chaine particuliere avec 
Foperateur de lien =~ (qui n'est pas un veritable operateur, mais plutot un indicateur du 
sujet de Foperation). Voici quelques exemples : 

$meuledefoin =~ m/aiguille/ # cherche un motif simple 

$meuledefoin =~ /aiguille/ # pareil 

$italiano =~ s/beurre/huile d'olive/ # une substitution bonne pour la sante 

$rotatel3 =~ tr/a-zA-Z/n-za-mN-ZA-M/ # encryption simple (a casser) 

Sans operateur de lien, c'est $_ qui est implicitement utilise comme "sujet" : 

/nouvelles vies/ and # explore $_ et (si on trouve quelque chose) 

/autres civilisations/ # au mepris du danger, explore encore $_ 

s/sucre/aspartame/ # substitue un substitut dans $_ 

tr/ATCG/TAGC/ # complemente le brin d'ADN dans $_ 

Comme si 1 1 et til 1 1 modifient le scalaire auquel ils sont appliques, vous ne pouvez 
les utiliser qu'avec des lvalues valides : 

"onshore" =~ s/on/off/; # FAUX : erreur a la compilation 

En revanche, mil fonctionne sur le resultat de n'importe quelle expression scalaire : 

if ((lc $chapeau_magique->contenu->comme_chaine) =~ /lapin/) { 
print "Euh, quoi d'neuf, docteur ?\n"; 

} 

else { 

print "Ce tour ne marche jamais !\n"; 

} 

Mais vous devez etre un petit peu prudent, car =~ et ! ~ ont une precedence assez elevee 
(dans notre exemple precedent les parentheses sont necessaires autour du terme de gau- 
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che). 4 L'operateur de lien ! ~ fonctionne comme =~, mais inverse la logique du resultat 
de l'operation : 

if ($romance !~ /parole/) { 

print qq/"$romance" semble etre une romance sans parole. W; 

} 

Comme mil, si 1 1 sont des operateurs apostrophes (ou guillemets), vous pouvez choisir 
vos delimiteurs. lis fonctionnent de la mime facon que les operateurs de citation q//, 
qq//, qr//, et qw// (voir la section Choisissez vos delimiteurs, chapitre 2, Composants de 
Perl). 

$path =~ s#/tmp#/var/tmp/scratch#; 

if ($dir =~ m[/bin]) { 

print "Pas de repertoires de binaires, s'il vous plait. \n"; 

} 

Quand vous utilisez des delimiteurs apparies avec sill ou til 1 1, si la premiere partie 
utilise Fune des quatre paires usuelles d'encadrement (parentheses, crochets, accolades 
ou chevrons), vous pouvez choisir des delimiteurs differents des premiers pour la secon- 
de partie : 

s(oeuf )<larve>; 
s{larve}{chrysalide}; 
s[chrysalide] /imago/; 

Les blancs sont autorises avant les delimiteurs ouvrants : 

s (oeuf) <larve>; 

s {larve} {chrysalide}; 

s [chrysalide] /imago/; 

A chaque fois qu'un motif correspond avec succes (y compris les motifs de substitution), 
il affecte aux variables $~, $& et $' le texte a gauche de la correspondance, le texte cor- 
respondant et le texte a droite de la correspondance. C'est utile pour separer les chames 
en leurs elements : 

"pain au chocolat" =~ /au/; 

print "Trouve : <$~> $& <$'>\n"; # Trouve : <pain > au < chocolat> 

print "Gauche : <$~>\n"; # Gauche : <pain > 

print "Correspondance : <$&>\n"; # Correspondance : <au> 

print "Droite : <$ J >\n"; # Droite : < chocolat> 

Pour plus d'efficacite et de controle, utilisez des parentheses pour capturer les portions 
specifiques que vous voulez conserver. Chaque paire de parentheses capture la sous- 
chaine correspondant au sous-motif entre parentheses. Les paires de parentheses sont nu- 
merotees de gauche a droite par la position de chaque parenthese ouvrante. Une fois la 
correspondance etablie, les sous-chames correspondantes sont disponibles dans les va- 
riables numerotees $1, $2, $3 et ainsi de suite : 5 



4. Sans les parentheses, le lc de moindre precedence se serait applique a toute la correspon- 
dance de motif plutot qu'au seul appel de methode sur le chapeau de magicien. 

5. Pas $0 cependant, qui contient le nom de votre programme. 
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$_ = "Bilbon Sacquet est ne le 22 Septembre"; 
/(.*) est ne le (.*)/; 
print "Personnel $l\n"; 
print "Date: $2\n"; 

$~ ,$&,$' et les variables numerotees sont implicitement localisees dans la portee dyna- 
mique les contenant. Elles durent jusqu'a la prochaine recherche reussie ou jusqu'a la 
fin de la portee courante, selon ce qui arrive en premier. Nous en reparlerons plus tard, 
dans un cadre different. 

Une fois que Perl a detecte que vous aurez besoin de l'une des variables $\ $& ou $' 
quelque part dans votre programme, il les fournira pour chaque correspondance. Cela 
va ralentir un peu votre programme. Comme Perl utilise un mecanisme semblable pour 
produire $1, $2et les autres, pour chaque motif contenant des parentheses de capture 
vous payez un peu en performance. (Voir Regroupement pour eviter le cout de la capture 
en conservant la possibilite de regrouper.) Si vous n'utilisez jamais $~, $& ou $', alors les 
motifs sans parentheses ne seront pas penalises. Si vous pouvez, il vaut done mieux en 
general eviter d'utiliser $~, $& et $', en particulier dans les modules de bibliotheque. 
Mais si vous devez les utiliser au moins une fois (et certains algorithmes apprecient vrai- 
ment leur commodite), alors utilisez-les autant que vous voulez, car vous avez deja paye 
le prix. $& n'est pas aussi couteux que les deux autres dans les versions recentes de Perl. 

Modificateurs de motif 

Nous allons discuter des differents operateurs de recherche de motif dans un moment, 
mais nous aimerions d'abord parler d'un de leur points communs a tous : les modifica- 
teurs. 

Vous pouvez placer un ou plusieurs modificateurs d'une lettre immediatement apres le 
delimiteur final, dans n'importe quel ordre. Par souci de clarte, les modificateurs sont 
souvent appeles « le modificateur lo » et prononces « le modificateur slash oh », 
meme si le modificateur final peut etre autre chose qu'un slash. (Certaines personnes 
disent « drapeau » ou « option » pour « modificateur ». C'est bien aussi.) 

Certains modificateurs changent le comportement d'un seul operateur, aussi les decri- 
rons-nous en detail plus loin. D'autres changent la facon dont la regex est interpretee. 
Les operateurs m//, si 1 1 et qr// 6 acceptent tous les modificateurs suivants apres le de- 
limiteur final : 



Modificateur 


Signification 


/i 


Ignore les distinctions de casse des caracteres (insensible a la casse). 


Is 


Fait correspondre . avec le saut de ligne et ignore la variable obsolete $*. 


/m 


Fait correspondre A et $ a cote d'un \n interieur. 


/X 


Ignore (la plupart) des blancs et autorise les commentaires dans le motif. 


/o 


Ne compile le motif qu'une seule fois. 



6. L'operateur til 1 1 ne prend pas de regex, aussi ces modificateurs ne s'y appliquent pas. 
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Le modificateur /i indique de faire la correspondance a la fois en majuscules et en mi- 
nuscules (et en casse de titre en Unicode). Ainsi /perl/i correspondrait avec 
« SUPERLATIF » ou « Perlimpinpin » (entre autres choses). Le pragma use locale peut 
aussi avoir une influence sur ce qui est considere comme equivalent. (Cela peut avoir 
une mauvaise influence sur les chaines contenant de FUnicode.) 

Les modificateurs /s et /m n'impliquent rien de coquin. lis affectent la maniere dont 
Perl traite les correspondances avec des chaines contenant des sauts de ligne. lis n'indi- 
quent pas si votre chaine contient reellement des sauts de ligne ; mais plutot si Perl doit 
supposer que votre chaine contient une seule ligne (/s) ou plusieurs lignes (/m), car cer- 
tains metacaracteres fonctionnent differemment selon qu'ils sont censes se comporter 
d'une maniere orientee ligne ou non. 

D'ordinaire le metacaractere « . » correspond a tout caractere sauf un saut de ligne, par- 
ce que sa signification traditionnelle est de correspondre aux caracteres a l'interieur 
d'une ligne. Avec un /s cependant, le metacaractere « . » peut aussi correspondre a des 
sauts de ligne, car vous avez dit a Perl d'ignorer le fait que la chaine contient plusieurs 
sauts de ligne. (Le modificateur /s fait aussi ignorer a Perl la variable obsolete $*, dont 
nous esperons que vous l'ignoriez aussi.) Le modificateur /m, de son cote, change In- 
terpretation des metacaracteres A et $ en leur permettant de correspondre a cote de sauts 
de lignes a l'interieur de la chaine au lieu de considerer seulement les extremites de la 
chaine. Voir les exemples dans la section Positions plus loin dans ce chapitre. 

Le modificateur /o controle la recompilation des motifs. Sauf si les delimiteurs sont des 
apostrophes simples, (m' MOTIF', s' MOTIF' REMPLACEMENT', ou qr'MOTIF'), toute variable 
dans le motif sera interpolee (et pourra provoquer la recompilation du motif) a chaque 
fois que l'operateur de motif sera evalue. Si vous voulez qu'un motif ne soit compile 
qu'une fois et une seule, servez-vous du modificateur / o. Cela empeche une recompila- 
tion couteuse a l'execution ; cela peut servir quand la valeur interpolee ne change pas 
au cours de l'execution. Cependant, utiliser /o revient a faire la promesse de ne pas mo- 
difier les variables dans le motif. Si vous les modifiez, Perl ne s'en rendra meme pas 
compte. Pour avoir un meilleur controle de la recompilation des motifs, utilisez l'ope- 
rateur de citation de regex qr//. Pour plus de details, voir la section Interpolation de va- 
riables plus loin dans ce chapitre. 

Le modificateur /x est l'expressif : il vous permet d'exploiter les blancs et les commen- 
taires explicatifs pour exalter la lisibilite de votre motif, ou meme lui permettre d'explo- 
rer au-dela des limites des lignes. 

Euh, c'est-a-dire que /x modifie la signification des blancs (et du caractere #) : au lieu de 
les laisser se correspondre a eux-memes comme le font les caracteres ordinaires, il les 
transforme en metacaracteres qui, etrangement, se comportent comme les blancs (et les 
caracteres de commentaires) devraient le faire. /x permet done l'utilisation d'espaces, de 
tabulations et de sauts de lignes pour le formatage, exactement comme le code Perl ha- 
bituel. II permet egalement l'utilisation du caractere #, qui n'est normalement pas un 
caractere special dans un motif, pour introduire un commentaire qui s'etend jusqu'au 
bout de la ligne en cours a l'interieur de la chaine de motif. 7 Si vous voulez detecter un 
veritable espace (ou le caractere #), alors vous devrez le mettre dans une classe de carac- 
teres, le proteger avec un antislash ou bien l'encoder en octal ou en hexadecimal. (Mais 
les blancs sont normalement detectes avec une sequence \s* ou \s+, done la situation 
ne se rencontre pas souvent en pratique.) 



132 



Chapitre 5 — Recherche de motif 



A dies toutes, ces fonctionnalites font beaucoup pour rendre les expressions regulieres 
plus proches d'un langage lisible. Dans Fesprit de TMTOWTDI, il existe done plus d'une 
maniere d'ecrire une meme expression rationnelle. En fait, il y a plus de deux manieres : 



m/\w+:(\s+\w+)\s*\d+/; 
chiffres. 



# Mot, deux-points, espace, mot, espace, 



m/\w+: (\s+ \w+) \s* \d+/x; 
chiffres. 



# Mot, deux-points, espace, mot, espace, 



m{ 



\w+: 
( 



) 

\s* 
\d+ 



\s+ 
\w+ 



# Detecte un mot et un deux-points. 

# (debut de groupe) 

# Detecte un ou plusieurs blancs. 

# Detecte un autre mot. 

# (fin de groupe) 

# Detecte zero ou plusieurs blancs. 

# Detecte des chiffres. 



}x; 



Nous expliquerons ces nouveaux metasymboles plus loin dans ce chapitre. (Cette sec- 
tion etait supposee decrire les modificateurs de motifs, mais nous l'avons laisser deriver 
dans notre excitation au sujet de /x. Bref.) Voici une expression reguliere qui trouve les 
mots doubles dans un paragraphe, emprunte a Perl en action (The Perl Cookbook). II uti- 
lise les modificateurs /x et /i, ainsi que le modificateur /g decrit plus loin. 

# Trouve les doublons dans les paragraphes, si possible malgre les 

# enjambements. 

# Utilise /x pour les espaces et les commentaires, / pour detecter les 

# deux 'tout' dans "Tout tout va bien ?", et /g pour trouver tous les 

# doublons. 

# mode "paragrep" 



$/ = ""; 
while (<>) { 
while ( m{ 



\b 

(\w\S+) 
( 

\s+ 
\1 



) + 
\b 

}xig 



# commence a une limite de mot 

# trouve un morceau de "mot" 

# separe par des blancs 

# et ce meme morceau 

# ad lib 

# jusqu'a une autre limite de mot 



print "doublon '$1' au paragraphe $.\n"; 



7. Faites attention cependant a ne pas inclure le delimiteur de motif dans le commentaire. A 
cause de sa regie "trouve la fin d'abord", Perl n'a aucun moyen de savoir que vous n'aviez pas 
l'intention de fmir le motif a cet endroit. 
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Quand on l'execute sur ce chapitre, il affiche des avertissements tels que : 

doublon 'nous' au paragraphe 36 
Bien stir, nous nous sommes apercus que dans ce cas particulier c'est normal. 



L'operateur m// (match) 



EXPR =~ m/MOTIF/cgimosx 
EXPR =~ /MOTIF /cgimosx 
EXPR =~ ?MOTIF?cgimosx 
m/MOTIF/cgimosx 
/MOTIF/cgimosx 
?MOTIF?cgimosx 

L'operateur m// recherche dans la chaine contenue dans le scalaire EXPR le motif MOTIF. 
Si le delimiteur est /ou ?, le m initial est facultatif. ? et ' ont tous deux une signification 
particuliere en tant que delimiteurs : le premier fait une detection a usage unique, le 
second supprime l'interpolation de variables et les six sequences de traduction (\U et 
autres, decrits plus loin). 

Si 1'evaluation de MOTIF conduit a une chame vide, soit parce que vous Favez specifie 
ainsi en utilisant // ou parce qu'une variable interpolee a donne la chame vide, la der- 
niere expression reguliere executee avec succes sans etre cachee a l'interieur d'un bloc 
inclus (ou a l'interieur d'un split, grep ou map) est executee a la place. 

En contexte scalaire, l'operateur renvoie vrai (1) en cas de succes, et faux ("") sinon. Cet- 
te forme se rencontre habituellement en contexte booleen : 

if ($comte =~ m/Sacquet/) { . . . } # recherche Sacquet dans la $comte 
if ($comte =~ /Sacquet/) { ... } # recherche Sacquet dans la $comte 

if ( m#Sacquet# ) {...}# cherche ici dans $_ 

if ( /Sacquet/ ) {...}# cherche ici dans $_ 

Utilise en contexte de liste, m// renvoie la liste des sous-chaines detectees par les paren- 
theses de capture du motif (c'est-a-dire $1, $2, $3 et ainsi de suite), comme cela est decrit 
plus loin dans la section Capture et regroupement. Les variables numerotees sont modi- 
fiers malgre tout, meme si la liste est retournee. Si la recherche reussit en contexte de 
liste mais qu'il n'y avait pas de parentheses de capture (ni de /g), une liste consistant en 
(l) est retournee. Comme elle renvoie la liste vide en cas d'echec, cette forme de m// 
peut aussi etre utilisee en contexte booleen, mais seulement quand elle y participe in- 
directement via une affectation de liste : 

if (($cle,$valeur) = /(\w+): (.*)/) { ... } 

Les modificateurs valides pour m// (sous toutes ses formes) sont listes dans le tableau 5-1. 

Les cinq premiers modificateurs s'appliquent a la regex et ont ete decrits precedem- 
ment. Les deux derniers modifient le comportement de l'operateur lui-meme. Le mo- 
dificateur /g indique une detection globale — c'est-a-dire que Ton recherche autant de 
fois qu'il est possible a l'interieur de la chame. La facon dont cela se comporte depend 
du contexte. En contexte de liste, m//g renvoie la liste de toutes les occurrences trouvees. 
Dans l'exemple suivant nous trouvons toutes les endroits oil quelqu'un a mentionne 
« perl », « Perl », « PERL », et ainsi de suite : 
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Tableau 5-1. Modificateurs de m// 



Modificateur 


Signification 


/i 


Ignore la casse des caracteres. 


/m 

/in 


Permet a A et $ de fonctionner a cote d'un \n. 


IS 


Permet au . de detecter des sauts de lignes et ignore la variable obsolete 
$*. 

Ignore (presque tous) les blancs et permet les commentaires a l'interieur 
du motif. 


/X 


/o 


Compile le motif une seule fois. 


1% 


Recherche globale, pour detecter toutes les occurrences. 


/eg 


Permet de continuer la recherche apres un echec dans /g. 


if ((Sperls 
printf 

} 


= $paragraphe =~ /perl/gi) { 

'Perl a ete mentionne %d fois.Nn", scalar @perls; 



S'il n'y a pas de parentheses de capture dans le motif /g, alors les correspondances com- 
pletes sont renvoyees. S'il y a des parentheses de capture, seules les chaines capturees 
sont retournees. Imaginez une chaine comme celle-ci : 

$chaine = "password=xyzzy verbose=9 score=0"; 

Imaginez egalement que vous souhaitez initialiser un hachage comme ceci : 

%hash = (password => "xyzzy", verbose => 9, score => 0); 

Sauf evidemment que vous n'avez pas une liste, vous avez une chaine. Pour obtenir la 
liste correspondante, vous pouvez utiliser l'operateur m//g en contexte de liste pour cap- 
turer tous les couples cle/valeur de la chaine : 

%hash = $chaine =~ /(\w+)=(\w+)/g; 

La sequence (\w+) capture un mot alphanumerique. Voir la section Capture et regroupe- 
ment. 

Utilise en contexte scalaire, le modificateur /g indique une detection progressive, qui re- 
prend une nouvelle recherche sur la meme chaine a la position qui suit celle oil la der- 
niere s'est arretee. L'assertion \C represente cette position dans la chaine. Voir la section 
Positions plus loin dans ce chapitre pour une description de \C. Si vous utilisez le modi- 
ficateur /c (pour « continuer ») en plus de /g, alors quand le /g ne detecte plus rien, la 
detection ratee ne reinitialise pas le pointeur de position. 

Si le delimiteur est ?, comme dans 7MOTIF7, la recherche fonctionne comme un /MOTIF/ 
normal, sauf qu'elle ne trouve qu'une seule occurrence entre deux appels a l'operateur 
reset. Cela peut etre une optimisation utile, quand vous desirez detecter seulement la 
premiere occurrence du motif pendant l'execution du programme, et pas toutes les oc- 
currences. L'operateur fait la recherche a chaque fois que vous l'appelez, jusqu'a ce qu'il 
trouve finalement quelque chose, a la suite de quoi il se bloque de lui-meme, renvoyant 
faux jusqu'a ce que vous le reenclenchiez avec reset. Perl se souvient de l'etat de la de- 
tection pour vous. 

L'operateur ? ? est particulierement utile quand une recherche de motif ordinaire trou- 
verait la derniere occurrence plutot que la premiere : 
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open DICTj "/usr/dict/words_fr" or die "Impossible d'ouvrir words_fr: $!\n"; 
while (<DICT>) { 

$premier = $1 if ?( A neur.*)?; 

$dernier = $1 if /( A neur .*)/; 

} 

print $premier, "\n"; # affiche "neural" 

print $dernier, "\n"; # affiche "neurula" 

L'operateur reset ne reinitialisera que les instances de ? ? qui ont ete compilees dans le 
meme paquetage que l'appel a reset, m?? et ?? sont equivalents. 



L'operateur s/// (substitution) 



LVALUE =~ si MOTIF/ REMPLACEMENT legimosx 
s /MOTIF/ REMPLACEMENT/ egimosx 

Cet operateur recherche MOTIF dans une chame, et s'il le detecte, remplace la chaine cor- 
respondante par le texte de REMPLACEMENT. (Les modificateurs sont decrits plus loin dans 
cette section.) 

$lotr = $hobbit; # Copie juste Bilbon le hobbit 

$lotr =~ s/Bilbon/Frodon/g; # et ecrit tres simplement une suite. 

La valeur de retour d'un si 1 1 (en contexte scalaire comme en contexte de liste) est le 
nombre de fois qu'il a reussit (ce qui peut etre plus d'une fois s'il a ete utilise avec le mo- 
dificateur /g decrit plus tot). En cas d'echec, il renvoie faux ( " " ), qui est numeriquement 
equivalent a 0. 

if ($lotr =~ s/Bilbon/Frodon/) { print "Suite ecrite avec succes." } 
$changements = $lotr =~ s/Bilbon/Frodon/g; 

La partie de remplacement est traitee comme une chaine entre apostrophes doubles. 
Vous pouvez utiliser toutes les variables a portee dynamique decrites plus tot ($" , $&, $', 
$1, $2, et ainsi de suite) dans la chaine de remplacement, ainsi que tous les trues utilisa- 
bles avec des apostrophes doubles. Voici un exemple qui trouve toutes les chaines 
« revision », « version », ou « release », et les remplace chacune par son equivalent 
avec une majuscule, a Faide de la sequence d'echappement \u dans la partie de rempla- 
cement : 

s/revision|version|release/\u$&/g; # Utilisez | pour dire "ou" 

# dans un motif 

Toutes les variables scalaires sont interpolees en contexte d'apostrophes doubles, et pas 
seulement les etranges que nous venons de voir. Supposons que vous ayez un hachage 
%Noms qui fasse correspondre aux numeros de version des noms de projet interne ; par 
exemple $Noms{"3.0"} pourrait avoir le nom de code « Isengard ». Vous pourriez uti- 
liser si 1 1 pour trouver les numeros de version et les remplacer par le nom des projets 
correspondants : 

s/version ([0-9.]+)/la livraison $Noms{$l}/g; 

Dans la chaine de remplacement, $1 retourne ce que la premiere (et unique) paire de 
parentheses a capture. (Vous auriez pu aussi utiliser \1 comme vous Fauriez fait dans le 
motif, mais cet emploi est obsolete dans le remplacement. Dans une chaine entre apos- 
trophes doubles normale, \1 signifie Controle-A.) 
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Si MOTIF est une chaine vide, la derniere expression reguliere executee avec succes est uti- 
lised a la place. MOTIF et REMPLACEMENT sont tous deux sujets a l'interpolation de varia- 
bles. Cependant, un MOTIF est interpole a chaque evaluation du si II en tant que tel, 
tandis que le REMPLACEMENT n'est evalue qu'a chaque fois qu'une correspondance est 
trouvee. (Le MOTIF peut correspondre plusieurs fois en une evaluation si vous utilisez le 
modificateur lg.) 

Comme precedemment, les cinq modificateurs du tableau 5-2 modifient le comporte- 
ment de la regex ; ce sont les memes que pour mil et qr//. Les deux derniers affectent 
l'operateur de substitution lui-meme. 



Tableau 5-2. Modificateurs de s/// 



Modificateur 


Signification 


/i 


Ignore la casse des caracteres (lors de la correspondance). 


/m 


Permet a A et $ de fonctionner a cote d'un \n. 


Is 


Permet au . de detecter des sauts de ligne et ignore la variable obsolete 
$*. 


/X 


Ignore (presque tous) les blancs et permet les commentaires a l'interieur 




du motif. 


/o 


Compile le motif une seule fois. 


/g 


Replacement global, c'est-a-dire de toutes les occurrences. 


le 


Evalue la partie droite comme une expression. 



Le modificateur lg est utilise avec si I 1 pour remplacer chaque occurrence de MOTIF par 
la valeur REMPLACEMENT, et pas seulement la premiere rencontree. Un operateur s///g 
agit comme un rechercher-remplacer global, en faisant toutes les modifications en une 
seule fois. Tout comme un m//g en contexte de liste, sauf que m//g ne change rien. (Et 
que s///g ne fait pas de detection progressive comme le faisait un m//g en contexte sca- 
lane.) 

Le modificateur le traite le REMPLACEMENT comme s'il s'agissait d'un bout de code Perl 
plutot que d'une chaine interpolee. Le resultat de l'execution de ce code est utilise com- 
me chaine de remplacement. Par exemple, s/([0-9]+)/sprintf ("%#x", $l)/ge rem- 
placerait 2581 par Oxb23. Ou supposez que dans notre exemple precedent, vous n'ayez 
pas ete sur de disposer d'un nom pour toutes les versions et que vous ayez voulu laisser 
inchangees les versions sans nom. Avec un formatage un peu creatif de /x, vous auriez 
pu ecrire : 

s{ 

version 

\s+ 

( 

[0-9.]+ 

) 

}{ 

$Noms{$l} 

? "la livraison $Names{$l}" 
: $& 

}xge; 
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La partie droite de votre s///e (ou dans ce cas, la partie basse) est verifiee syntaxique- 
ment et compilee en meme temps que le reste de votre programme. Toute erreur de syn- 
taxe est detectee a la compilation, et les exceptions dynamiques ne sont pas relevees. 
Chaque nouveau /e ajoute a la suite du premier (comme /ee, /eee et ainsi de suite) re- 
vient a appeler eval CHAINE sur le resultat du code, une fois par /e supplementaire. Ceci 
evalue le resultat du code dans l'expression et capture les exceptions dans la variable spe- 
ciale $@. Voir la section Motifs programmatiques plus loin dans ce chapitre pour plus de 
details. 

Modifier les chaines en passant 

Parfois vous voulez une nouvelle chame, modifiee sans alterer celle sur laquelle elle est 
basee. Au lieu d'ecrire : 

$lotr = $hobbit; 

$lotr =~ s/Bilbon/Frodon/g; 

vous pouvez combiner ces deux instructions en une seule. A cause de la precedence, des 
parentheses sont requises autour de 1'afFectation, tout comme dans la plupart des com- 
binaisons appliquant =~ a une expression. 

($lotr = $hobbit) =~ s/Bilbon/Frodon/g; 

Sans les parentheses autour de l'affectation, vous n'auriez fait que changer $hobbit et 
recuperer le nombre de modifications dans $lotr, ce qui nous aurait donne une suite 
fort peu interessante. 

Vous ne pouvez pas utiliser un operateur s/// directement sur un tableau. Pour cela, 
vous aurez besoin d'une boucle. Par une heureuse coincidence, l'idiome Perl standard 
pour rechercher et modifier sur chaque element d'un tableau s'obtient grace au systeme 
d'alias de f or/f oreach, combine avec Futilisation de $_ comme variable par defaut de la 
boucle : 

for (@chapitres) { s/Bilbon/Frodon/g } # Fait les substitutions chapitre 

# par chapitre. 
s/Bilbon/Frodon/g for @chapitres; # Pareil. 

Comme avec les variables scalaires, vous pouvez egalement combiner substitution et af- 
fectation si vous desirez conserver une copie de l'original : 

(Sanciens = ('oiseau bleu', 'bleu roi', 'bleu nuit', 'bleu de travail'); 
for (@nouveaux = @anciens) { s/bleu/rouge/ } 
print "@nouveaux\n"; # affiche : oiseau rouge rouge roi rouge 
# nuit rouge de travail 

La maniere idiomatique d'appliquer des substitutions repetees sur une meme variable 
est d'utiliser une boucle a un seul tour. Par exemple, voici comment normaliser les 
blancs dans une variable : 

for ($chaine) { 

s/ A \s+//; # supprime les blancs au debut 

s/\s+$//; # supprime les blancs a la fin 

s/\s+/ /g; # minimise les blancs internes 

} 
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ce qui produit exactement le mime resultat que : 

$chaine = join(" ", split " ", $chaine); 

Vous pouvez egalement utiliser une telle boucle dans une affectation, comme nous 
l'avons fait dans le cas du tableau : 

for ($nouveau = $ancien) { 
s/Fred/Homer/g; 
s/Wilma/Marge/g; 
s/Pebbles/Lisa/g; 
s/Dino/Bart/g; 

} 

Quand une substitution globale n'est pas assez globale 

De temps en temps, vous ne pouvez tout simplement pas utiliser un /g pour que tous 
les changements soient fairs, soit parce que les substitutions se produisent de droite a 
gauche, soit parce que la longueur de $~ doit changer entre deux occurrences. En gene- 
ral, vous pouvez faire cela en appelant si 1 1 a repetition. Mais vous voulez tout de 
meme que la boucle s'arrete quand le si 1 1 finit par echouer, ce qui ne laisse rien a faire 
dans la partie principale de la boucle. Alors nous ecrivons un simple 1, qui est une chose 
plutot ennuyeuse a faire, mais souvent le mieux que vous pouvez esperer. Voici quel- 
ques exemples qui utilisent quelques unes des ces etranges bestioles que sont les regex : 

# met des points aux bons endroits dans un entier 
1 while s/(\d)(\d\d\d)(?!\d)/$l.$2/; 

# change les tabulations pour des espacements sur 8 colonnes 
1 while s/\t+/' ' x (length($&)*8 - length($~ )%8)/e; 

# supprime les parentheses (imbriquees (ou meme tres imbriquees (comme ca))) 
1 while s/\([ A ()]*\)//g; 

# supprime les doublons (et les triplons (et les quadruplons. . .)) 
1 while s/\b(\w+) \l\b/$l/gi; 

Cette derniere necessite une boucle car sinon elle transformerait ceci : 

Paris AU AU AU AU printemps. 
en cela : 

Paris AU AU printemps. 

L'operateur tr/// (translitteration) 

LVALUE =~ ti/LISTEDERECHERCHE/LISTEDEREMPLACEMENT/cds 
ti/LISTEDERECHERCHE/LISTEDEREMPLACEMENT/cds 

Pour les fans de sed, y/// est fourni comme synonyme de tr///. C'est la raison pour la- 
quelle vous ne pouvez pas plus appeler une fonction y que vous ne pouvez l'appeler q 
ou m. Hormis cela, y/// est exactement identique a tr/// et nous ne le mentionnerons 
plus. 
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Cet operateur n'aurait pas vraiment de raison d'apparaitre dans un chapitre consacre a 
la detection de motif, puisqu'il n'utilise pas de motif. Cet operateur balaie une chaine 
caractere par caractere, et remplace chaque occurrence d'un caractere de LISTEDERE- 
CHERCHE (qui n'est pas une expression reguliere) par le caractere correspondant dans 
LISTEDEREMPLACEMENT (qui n'est pas une chaine de remplacement). Cependant, il res- 
semble un peu a m// et a s///, et vous pouvez meme utiliser les operateurs de lien =~ 
et !~ dessus. C'est pourquoi nous le decrivons ici. (qr// et split sont des operateurs de 
recherche de motif, mais on ne peut pas utiliser les operateurs de lien dessus, c'est pour- 
quoi ils sont ailleurs dans ce livre. Allez comprendre.) 

La transliteration retourne le nombre de caracteres remplaces ou effaces. Si aucune 
chaine n'est specfiee par les operateurs =~ ou ! ~, c'est la chaine $_ qui est modifiee. 
LISTEDERECHERCHE et LISTEDEREMPLACEMENT peuvent definir des intervalles de caracte- 
res successifs a l'aide d'un tiret : 

$message =~ tr/A-Za-z/N-ZA-Mn-za-m/; # cryptage rotl3. 

Remarquez qu'un intervalle comme A-Z suppose un ensemble de caracteres lineaire 
comme l'est la table ASCII. Mais chaque ensemble de caracteres a son propre point de 
vue concernant l'ordre de ses caracteres, et done de quels caracteres font partie d'un in- 
tervalle particulier. Un principe sain est d'utiliser des intervalles qui commencent et fi- 
nissent sur des caracteres de la meme casse (a-e, A-E) ou des chiffres (0-4). Tout le reste 
est suspect. En cas de doute, decrivez l'ensemble qui vous interesse en entier : ABCDE. 

LISTEDERECHERCHE et LISTEDEREMPLACEMENT ne subissent pas d'interpolation de variable 
comme des chaines entre apostrophes doubles ; vous pouvez cependant utiliser les se- 
quences avec antislash qui correspondent a des caracteres specifiques, comme \n ou 
\015. 

Le tableau tableau 5-3 donne la liste des modificateurs qui s'appliquent a l'operateur 
tr///. Ils sont completement differents de ceux que vous appliquez a m//, si 1 1 ou qr//, 
meme si certains d'entre eux y ressemblent. Si le modificateur /c est specifie, le jeu de 
caracteres dans LISTEDERECHERCHE est complements ; e'est-a-dire que la liste de recher- 
che effective comprend tous les caracteres qui ne se trouvent pas dans LISTEDERECHER- 
CHE. Dans le cas de l'Unicode, cela peut representer un grand nombre de caracteres, mais 
comme ils sont stockes logiquement et non physiquement, vous n'avez pas a vous in- 
quieter d'un eventuel manque de memoire. 



Tableau 5-3. Modificateurs de tr/// 



Modificateur 


Signification 


/c 


Complemente la LISTEDERECHERCHE. 


/d 


Supprime les caracteres trouves mais non remplaces. 


/s 


Concentre les caracteres dupliques remplaces. 



Le modificateur /d transforme tr/// en ce qu'on pourrait appeler l'operateur de 
« transobliteration » : tout caractere specifie par LISTEDERECHERCHE mais qui n'a pas de 
caractere de remplacement dans LISTEDEREMPLACEMENT est efface. (C'est un peu plus 
souple que le comportement de certains fr(l), qui effacent tout ce qu'ils trouvent dans 
LISTEDERECHERCHE, point.) 
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Si le modificateur /s est specifie, les suites de caracteres qui sont convertis en un carac- 
tere identique sont reduites a un seul exemplaire de ce caractere. 

Si le modificateur I A est utilise, LISTEDEREMPLACEMENT est toujours interpretee comme 
elle est speciflee. Sinon, si LISTEDEREMPLACEMENT est plus courte que LISTEDERECHERCHE, 
le dernier caractere est replique jusqu'a ce qu'elle soit assez longue. Si LISTEDEREMPLACE- 
MENT est vide, la LISTEDERECHERCHE est repliquee, ce qui est etonnamment utile si vous 
voulez juste compter les caracteres, et non les modifier. C'est aussi utile pour compacter 
les sequences de caracteres. avec /s. 

tr/aeiou/!/; # change toutes les voyelles en ! 

tr{/\\\r\n\b\f . }{_}; # change les caracteres bizarres en soulignes 

tr/A-Z/a-z/ for @ARGV; # normalise en minuscules ASCII 

$compte = ($para =~ tr/\n//); # compte les sauts de lignes dans $para 
$compte = tr/0-9//; # compte les chiffres dans $_ 

$mot =~ tr/a-zA-Z//s; # illettrisme -> iletrisme 

tr/@$%*//d; # supprime tous ceux la 

tr#A-Za-zO-9+/##cd; # supprime les caracteres hors base64 

# change en passant 

($H0TE = $hote) =~ tr/a-z/A-Z/; 

$pathname =~ tr/a-zA-Z/_/cs; # change les caracteres ASCII non 

# alphabetiques en un seul souligne 

tr [\200-\377] 

[\000-\177]; # supprime le 8e bit de chaque octet 

Si le meme caractere apparait plusieurs fois dans la LISTEDERECHERCHE, seul le premier 
est utilise. Ainsi, ceci : 

tr/AAA/XYZ/ 

changera tout A en X (dans $_). 

Bien que les variables ne soient pas interpolees par tr///, vous pouvez obtenir le meme 
effet en utilisant eval EXPR : 

$compte = eval "tr/$ancien/$nouveau/"; 

die if $@; # propage 1' exception due a un contenu de eval incorrect 

Encore un mot : si vous voulez passer votre texte en majuscules ou en minuscules, n'uti- 
lisez pas tr///. Utilisez plutot les sequences \U ou \ L dans des chaines entre apostrophes 
doubles (l'equivalent des fonctions ucet lc) car elles seront attentives aux informations 
de locales et a l'Unicode, alors que tr/a-z/A-Z ne le sera pas. De plus, dans les chaines 
Unicode, la sequence \u et la fonction correspondante ucf irst comprennent la notion 
de casse de titre, ce qui pour certaines langues peut etre different de simplement con- 
vertir en majuscules. 
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Metacaracteres et metasymboles 

Maintenant que nous avons admire les jolies cages, nous pouvons de nouveau nous in- 
teresser aux bestioles dans ces cages, les etranges caracteres que vous mettez dans les mo- 
tifs. Maintenant vous avez compris que ces symboles ne sont pas du code Perl normal 
comme les appels de fonction ou les operateurs arithmetiques. Les expressions regulie- 
res ont leur propre petit langage inclus dans Perl. (Chacun a son jardin et sa jungle se- 
crete.) 

Malgre leur puissance et leur expressivite, les motifs de Perl reconnaissent les memes 12 
caracteres traditionnels (les « Douze salopards », s'il en est) qu'on trouve dans de nom- 
breux autres modules d'expressions regulieres. 

\ | ( ) [ { A $ * + ? . 

Certains d'entre eux changent les regies, rendant speciaux les caracteres normaux qui les 
suivent. Nous n'aimons pas appeler les sequences de plus d'un caractere des 
« caracteres », c'est pourquoi nous les appelerons metasymboles (ou meme seulement 
« symboles »). Mais au plus haut niveau, ces douze metacaracteres sont tout ce dont 
vous (et Perl) avez a vous inquieter. Tout le reste precede de la. 

Certains metacaracteres simples fonctionnent par eux-memes, comme . , A et $. lis n'af- 
fectent directement rien de ce qui les entoure. Certains metacaracteres fonctionnent 
commes des operateurs prefixes, controlant ce qui les suit, comme \. D'autres fonction- 
nent comme des operateurs postfixes, et controlent ce qui les precede immediatement, 
comme *, + et ?. Un metacaractere, | , fonctionne comme un operateur infixe, en se te- 
nant entre les deux operandes qu'il affecte. II existe meme des metacaracteres de paren- 
thesage, qui fonctionnent comme des operateurs « circonfixes », et regissent ce qu'ils 
contiennent, comme (...) et [...]. Les parentheses sont particulierement importan- 
tes, car elles definissent les limites de | a l'interieur, et celles de *, + et ? a l'exterieur. 

Si vous n'apprenez qu'un seul des douze metacaracteres, choisissez l'antislash. (Euh... et 
les parentheses.) C'est parce que l'antislash invalide les autres. Quand un antislash pre- 
cede un caractere non alphanumerique dans un motif Perl, il en fait toujours un carac- 
tere litteral. Si vous avez besoin de faire une correspondance litterale avec Fun des douze 
metacaracteres, vous n'avez qu'a l'ecrire precede d'un antislash. Ainsi, \ . est un vrai 
point, \$ un vrai dollar, \\ un vrai antislash, et ainsi de suite. On appelle cela 
« proteger » le metacaractere, ou simplement F« antislasher ». (Bien sur, vous savez 
deja que l'antislash sert a supprimer l'interpolation de variable dans les chaines entre 
apostrophes doubles.) 

Bien qu'un antislash transforme un metacaractere en caractere litteral, il a l'effet inverse 
sur un caractere alphanumerique le suivant. II prend ce qui etait normal et le rend spe- 
cial. C'est-a-dire qu'a eux deux, ils forment un metasymbole. Une liste alphabetique de 
ces metasymboles se trouve juste en dessous dans le tableau 5-7. 

Tables de metasymboles 

Dans les tableaux qui suivent, la colonne Atomique indique « Oui » si le metasymbole 
correspondant est quantifiable (c'est-a-dire s'il peut correspondre a quelque chose qui a 
une largeur, plus ou moins). Nous avons egalement utilise « . . . » pour representer 
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« quelque chose d'autre ». (Consultez la discussion qui suit pour savoir ce que « . . . » 
signifie, si le commentaire du tableau n'est pas suffisant.) 

Le tableau 5-4 liste les metasymboles traditionnels de base. Les quatre premiers sont les 
metasymboles structured deja mentionnes, tandis que les trois suivants sont de simples 
metacaracteres. Le metacaractere . est un exemple d'atome car il correspond a quelque 
chose qui a une largeur (la largeur d'un caractere, dans ce cas) ; A et $ sont des exemples 
d'assertions, car ils correspondent a quelque chose de largeur nulle et ne sont evalues 
que pour savoir s'ils sont vrais ou faux. 

Tableau 5-4. Metacaracteres usuels de regex 



Symbole 



Atomique 



Signification 



\... 



(...) 
[...] 



Variable 

Non 

Oui 

Oui 



Rend le caractere non alphanumerique suivant litteral, rend 
le caractere alphanumerique suivant meta (peut-etre). 

Alternative (correspond a l'un ou l'autre). 

Regroupement (traite comme une unite). 

Classe de caracteres (correspond a un caractere d'un ensem- 
ble). 




Vrai au debut d'une chaine (ou apres toute nouvelle ligne, 
eventuellement). 

Correspond a un caractere (sauf le saut de ligne, normale- 
ment). 

Vrai en fin de chame (ou avant toute nouvelle ligne, even- 
tuellement). 



Les quantificateurs, decrits plus loin dans leur propre section, indiquent combien de 
fois Fatome qui les precede (caractere simple ou regroupement) doit correspondre. Ils 
sont listes dans le tableau 5-5. 



Tableau 5-5. Quantificateurs de regex 



Quantificateur 


Atomique 


Signification 


* 


Non 


Correspond 0 fois ou plus (maximal). 


+ 


Non 


Correspond 1 fois ou plus (maximal). 


? 


Non 


Correspond 0 ou 1 fois (maximal). 


{COMPTE} 


Non 


Correspond exactement COMPTE fois. 


{MIN, } 


No 


Correspond au moins MIN fois (maximal). 


{MIN,MAX} 


No 


Correspond au moins MIN fois, mais pas plus de MAX fois 






(maximal). 


*? 


Non 


Correspond 0 fois ou plus (minimal). 


+? 


Non 


Correspond 1 fois ou plus (minimal). 


?? 


Non 


Correspond 0 ou 1 fois (minimal). 


{MIN,}? 


Non 


Correspond au moins MIN fois (minimal). 


{MIN, MAX}? 


Non 


Correspond au moins MIN fois, mais pas plus de MAX fois 






(minimal). 
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Un quantificateur minimal essaie de correspondre aussi peu que possible dans l'inter- 
valle autorise. Un quantificateur maximal essaie de correspondre le plus possible, dans 
Fintervalle autorise. Par exemple, . + est sur de correspondre a au moins un des caracte- 
res de la chaihe, mais correspondra a tous s'il en a l'occasion. Ces occasions seront decri- 
tes plus loin dans « Le petit Moteur qui/(ne )?pouvait( pas)?/ ». 

Vous remarquerez qu'un quantificateur ne peut jamais etre quantifie. 

Nous voulions fournir une syntaxe extensible pour pouvoir introduire de nouveaux ty- 
pes de metasymboles. Etant donne que nous n'avions qu'une douzaine de metacaracte- 
res a notre disposition, nous avons choisi d'utiliser une sequence de regex 
anciennement incorrecte pour ces extensions syntaxiques arbitraires. Ces metasymboles 
sont tous de la forme (7CLE. . . ) ; c'est-a-dire une parenthese (equilibree) suivie d'un 
point d'interrogration, suivie par une CLE et le reste du sous-motif Le caractere CLE in- 
dique de quelle extension de regex il s'agit. Voyez le tableau 5-6 pour en avoir la liste. La 
plupart d'entre eux se comportent bien structurellement, car ils sont bases sur des pa- 
rentheses, mais ont egalement une signification supplementaire. De nouveau, seuls les 
atomes peuvent etre quantifies, car ils representent quelque chose qui est vraiment la 
(potentiellement). 



Tableau 5-6. Sequences de regex e'tendues 



Extension 


Atomique 


Signification 


(?#...) 


Non 


Commentaire, ignore. 


(?:...) 


Oui 


Parentheses de regroupement seul, sans capture. 


(?imsx-imsx) 


No 


Active/desactive les modificateurs de motif. 


(?imsx-imsx: . . . ) 


Oui 


Parentheses de regroupement, et modificateurs. 


(?=...) 


Non 


Vrai si l'assertion de pre-vision est un succes. 


(?!...) 


Non 


Vrai si l'assertion de pre-vision est un echec. 


(?<=...) 


Non 


Vrai si l'assertion de retro-vision est un succes. 


(?<!...) 


Non 


Vrai si l'assertion de retro-vision est un echec. 


(?»...) 


Yes 


Correspond au motif sans retour arriere. 


(?{•••}) 


Non 


Execute le code Perl inclus. 


(??{...}) 


Oui 


Fait correspondre la regex du code Perl inclus. 


(?(...)...!...) 


Oui 


Correspond avec un motif si-alors-sinon. 


(?(...)•••) 


Oui 


Correspond avec un motif si-alors. 



Enfin, tableau 5-7 donne la liste de tous les metasymboles alphanumeriques usuels. (Les 
symboles qui sont traites durant la passe d'interpolation de variables sont indiques avec 
un tiret dans la colonne Atomique, car le Moteur ne les voit jamais.) 

Les accolades sont facultatives pour \p et \P si le nom de la propriete fait un seul carac- 
tere. Les accolades sont facultatives pour \x si le nombre hexadecimal fait deux chiffres 
ou moins. Les accolades ne sont jamais facultatives pour \N. 
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Tableau 5-7. Metasymboles alphanume'riques de regex 



Symbole 


Atomique 


Signification 


\0 


Oui 


Correspond au caractere nul (ASCII NUL). 


\NNN 


Oui 


Correspond au caractere donne en octal, jusqu'a \377- 


\n 


Oui 


Correspond a la meme chame capturee (en decimal). 


\a 


Oui 


Correspond au caractere alarme (BEL). 


\A 


Non 


Vrai au debut d'une chaine. 


\b 


Oui 


Correspond au caractere espace arriere (BS). 


\ k 

\D 


Non 


Vrai a une limite de mot. 




Non 


Vrai hors d une limite de mot. 


\CA 


Oui 


Correspond au caractere de controle Controle-X (\cZ, \c[, 
etc.). 


\ r 
\L 


Oui 


Correspond a un octet (un char en C), meme en utf8 (dan- 
gereux). 


\d 


Oui 


Correspond a tout caractere numerique. 




Oui 


Correspond a tout caractere non numerique. 


\e 


Oui 


Correspond au caractere d'echappement (ASCII ESC, pas 
l'antislash). 


\E 




Termine la traduction de casse (\L, \U) ou la citation de 
metacaracteres. 


\f 


Oui 


Correspond au caractere de fin de page (FF). 


\G 


Non 


Vrai a la position de fin de recherche du m/ /g precedent. 


\1 




Passe le prochain caractere seulement en minuscules. 


\L 




Minuscules jusqu'au prochain \E. 


\n 


Oui 


Correspond au caractere de saut de ligne (en general NL, 
mais CR sur les Mac). 


\H{NAME) 


Oui 


Correspond au caractere nomme (\N{greek: Sigma}). 


\p\PKUr} 


Oui 


Correspond a tout caractere ayant la propriete citee. 


WyFKUr) 


Oui 


Correspond a tout caractere n'ayant pas la propriete citee. 


\0 




Cite les metacaracteres (desactive leur cote meta) jusqu'au 
prochain \E. 


\r 


Oui 


Correspond au caractere de retour chariot (CR en general, 
mais NL sur les Mac). 


\s 


Oui 


Correspond a tout caractere blanc. 


\S 


Oui 


Correspond a tout caractere non blanc. 


\I 


uui 


Correspond au caractere de tabulation (HT). 


\u 




Passe le prochain caractere seulement en grandes initiales. 


\U 




Passe en majuscules (et non en grandes initiales) jusqu'au 
prochain \E. 


\w 


Oui 


Correspond a tout caractere de « mot » (alphanumeriques 

et « _ »). 
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Tableau 5-7. Metasymboles alphanumeriques de regex (suite) 



Symbole 


Atomique 


Signification 


\W 


Oui 


Correspond a tout caractere non « mot ». 


\x{abcd} 


Oui 


Correspond au caractere donne en hexadecimal. 


\X 


Oui 


Correspond a une « sequence de caracteres Unicode 






combines ». 


\z 


Non 


Vrai seulement en fin de chaine. 


\Z 


Non 


Vrai en fin de chaine ou avant un eventuel saut de ligne. 



Seuls les metasymboles dont la description est « Correspond a... » peuvent etre utilises 
dans une classe de caracteres. C'est-a-dire que les classes de caracteres ne peuvent conte- 
nir que des ensembles specifiques de caracteres, et vous ne pouvez done utiliser a l'inte- 
rieur que des metasymboles qui decrivent d'autres ensembles specifiques de caracteres 
ou qui decrivent des caracteres individuels. Bien sur, ces metasymboles peuvent aussi 
etre utilises en dehors des classes de caracteres, avec les autres metasymboles (qui ne 
peuvent etre utilises qu'hors classe). Remarquez cependat que \b est en fait deux bestio- 
les completement differentes : e'est un espace arriere dans une classe de caracteres, mais 
une assertion de limite de mot en dehors. 

II y a un certain chevauchement entre les caracteres auxquels un motif peut correspon- 
dre et les caracteres qu'une chaine entre apostrophes doubles peut interpoler. Comme 
les regex subissent deux passes, il est parfois ambigu de savoir quelle passe doit traiter 
quel caractere. Quand il y a une ambigui'te, la passe d'interpolation de variable defere 
Interpretation de ces caracteres a Fanalyseur d'expressions regulieres. 

Mais la passe d'interpolation de variable ne peut deferer a Fanalyseur de regex que 
quand elle sait qu'elle est en train d'analyser une regex. Vous pouvez specifier des expres- 
sions regulieres comme des chaines entre apostrophes doubles ordinaires, mais vous de- 
vez alors suivre les regies normales des apostrophes doubles. Chacun des metasymboles 
precedents qui correspond a un caractere existant continuera de marcher, meme s'il 
n'est pas defere a l'analyseur de regex. Mais vous ne pourrez utiliser aucun des autres 
metasymboles entre des apostrophes doubles ordinaires (ou dans toute construction 
analogue comme qq (...), qx( .. .) ou les documents ici-meme equivalents). Si 

vous voulez que votre chaine soit analysee comme une expression reguliere sans faire 
de correspondance, vous devriez utiliser l'operateur qr// (quote regex). 

Notez que les sequences d'echappement de casse et de metacitation (\U et compagnie) 
doivent etre traites durant la passe d'interpolation, car leur role est de modifier la facon 
dont les variables sont interpolees. Si vous supprimez l'interpolation de variable avec 
des apostrophes simples, vous n'aurez pas non plus les sequences d'echappement. Ni les 
variables ni les sequences d'echappement (\U, etc.) ne sont etendues dans les chames en- 
tre apostrophes simples, ni dans les operateurs m' . . . ' ou qr' . . . ' avec apostrophes sim- 
ples. Et meme si vous faites une interpolation, ces sequences d'echappement sont 
ignorees si elles apparaissent dans le resultat de l'interpolation de variable, car a ce mo- 
ment-la il est trop tard pour inf luencer l'interpolation de variable. 

Bien que l'operateur de translitteration ne prenne pas d'expression reguliere, tout me- 
tasymbole precedemment discute qui correspond a un caractere specifique simple mar- 
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che aussi dans une operation tr///. Les autres ne marchent pas (sauf bien star Fantislash 
qui continue toujours a fonctionner a sa maniere bien a lui). 

Caracteres specifiques 

Comme mentionne precedemment, tout ce qui n'est pas special dans un motif se cor- 
respond a lui-meme. Cela signifie qu'un /a/ correspond a un « a », un /=/ correspond 
a un « = », et ainsi de suite. Certains caracteres ne sont cependant pas tres faciles a taper 
au clavier ou, meme si vous y arrivez ne s'afficheront pas lisiblement ; les caracteres de 
controle sont connus pour cela. Dans une expression reguliere, Perl reconnait les alias 
d'apostrophes doubles suivants : 



Echappement 


Signification 


\0 


Caractere nul (ASCII NUL) 


\a 


Alarme (BEL) 


\e 


Echappement (ESC) 


\f 


Fin de page (FF) 


\n 


Saut de ligne (NL, CR sur Mac) 


\r 


Retour chariot (CR, NL sur Mac) 


\t 


Tabulation (HT) 



Tout comme dans les chaines entre apostrophes doubles, Perl reconnait egalement les 
quatre metasymboles suivants dans les motifs : 

\cX 

Un caractere de controle nomme, comme \cC pour Controle-C, \cZ pour Controle- 
Z, \c[ pour ESC, et \c? pour DEL. 

\NNN 

Un caractere specifie en utilisant son code octal a deux ou trois chiffres. Le 0 initial 
est facultatif, sauf pour les valeurs inferieures a 010 (8 en decimal), car (contraire- 
ment aux chaines entre apostrophes doubles) les versions a un seul chiffre sont tou- 
jours considerees comme des references arrieres a des chaines capturees dans un 
motif. Les versions a plusieurs chiffres sont interpreters comme la meme reference 
arriere si vous avez capture au moins n sous-chaines plus tot dans le motif (avec n 
considere comme un nombre decimal). Sinon, elle est interpretee comme un carac- 
tere octal. 

\x{HEXL0NG} 

\xHEX 

Un caractere specifie par son numero a un ou deux chiffres hexadecimaux ([o-9a- 
f A-F]), comme \xlB. La forme a un seul chiffre est utilisable quand le caractere sui- 
vant n'est pas un chiffre hexadecimal. Si vous utilisez des accolades, vous pouvez 
mettre autant de chiffres que vous voulez, ce qui peut conduire a un caractere Uni- 
code. Par exemple, \x{262f } correspond a un YIN YANG Unicode. 
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\N{«OM} 

Un caractere nomme, comme \N{GREEK SMALL LETTER EPSILON}, \N{greek:epsi- 
lon}, ou \N{epsilon}. Ceci requiert l'utilisation du pragma use charnames decrit 
au chapitre 31, Modules de pragmas, et qui determine aussi lequel de ces noms vous 
pouvez utiliser (" : long", " : full", " : short" qui correspondent respectivement aux 
trois styles que nous venons de citer). 

Vous trouverez une liste de tous les noms de caracteres Unicode dans vos docu- 
ments de standard Unicode preferes ou dans le fichier PATH_TO_PERLLIB/uni- 
code/Names.txt. 

Metasymboles jokers 

Trois metasymboles speciaux sont utilises comme des jokers generiques, chacun d'entre 
eux correspondant a « tout » caractere (pour certaines valeurs de « tout »). Ce sont le 
point ("."), \C et \X. Aucun d'entre eux ne peut etre utilise dans une classe de caracteres. 
Vous ne pouvez pas y utiliser le point car il correspondrait a (presque) tout caractere 
existant. C'est done deja une sorte de classe de caracteres universelle par lui-meme. Si 
vous voulez tout inclure ou tout exclure, il n'y a pas grand interet a utiliser une classe 
de caracteres. Les jokers speciaux \C et \X ont une signification structurelle specifique 
qui ne s'accorde pas bien avec l'idee de choisir un seul caractere Unicode, ce qui est le 
niveau auquel fonctionne une classe de caracteres. 

Le metacaractere point correspond a tout caractere autre que le saut de ligne. (Et avec 
le modificateur /s, il lui correspond aussi.) Comme chacun des autres caracteres spe- 
ciaux dans un motif, pour correspondre a un point litteral, vous devez le proteger avec 
un antislash. Par exemple, ceci verifie si un nom de fichier se termine par un point suivi 
d'une extension a un caractere : 

if ($chemin =~ A.(.)\z/s) { 
print "Se termine par $l\n"; 

} 

Le premier point, celui qui est protege, est un caractere litteral, tandis que le second dit 
« correspond a tout caractere ». Le \z demande de ne correspondre qu'a la fin de la chai- 
ne, et le modificateur /s permet au point de correspondre egalement a un saut de ligne. 
(Certes, utiliser un saut de ligne comme extension n'est Pas Tres Gentil, mais cela ne 
veut pas dire que cela ne peut pas se produire.) 

Le metacaractere point est le plus souvent utilise avec un quantificateur. Un . * corres- 
pond a un nombre maximal de caracteres, tandis qu'un .*? correspond a un nombre 
minimal de caracteres. Mais il est aussi utilise parfois sans quantificateur pour sa propre 
largeur :/(..):(..):(..) / correspond a trois champs separes par des deux-points, cha- 
cun faisant deux caracteres de large. 

Si vous utilisez un point dans un motif compile sous le pragma a portee lexicale use 
utf 8, alors il correspondra a tout caractere Unicode. (Vous n'etes pas suppose avoir be- 
som de use utf 8 pour cela, mais il y a toujours des accidents. Le pragma peut ne plus 
etre utile d'ici a ce que vous lisiez ces lignes.) 

use utf8; 

use charnames qw/:full/; 
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$BWV[887] = "C\N{MUSIC SHARP SIGN} minor"; # partition anglaise 
($note, $noire, $mode) = $BWV[887] =~ / A ([A-G])(.)\s+(\S+)/; 
print "C'est en diese !\n" if $n eq chr(9839); 

Le metasymbole \X correspond a un caractere Unicode dans un sens plus etendu. II cor- 
respond en fait a une chaine d'un ou plusieurs caracteres Unicode connue sous le nom 
de « sequence de caracteres combines ». Une telle sequence consiste en un caractere de 
base suivi par Fun des caracteres de « marquage » (signe diacritique comme une cedille 
ou un trema) qui se combine avec le caractere de base pour former une unite logique. 
\X est exactement equivalent a ( ? : \PM\pM*). Cela permet de correspondre a un seul ca- 
ractere logique, mime si celui est en fait constitue de plusieurs caracteres distincts. La 
longueur de la correspondance de AX/ peut exceder un caractere si celui-ci a trouve des 
caracteres combines. (Et nous parlons ici de la longueur en caracteres, qui n'a pas grand 
chose a voir avec la longueur en octets.) 

Si vous utilisez Unicode et que vous voulez vraiment travailler sur un seul octet plutot 
que sur un seul caractere, vous pouvez utiliser le metasymbole \C. Ceci correspondra 
toujours a un seul octet (specifiquement, a un seul element de type char de C), mime 
si cela vous desynchronise de votre flux de caracteres Unicode. Referez-vous aux avertis- 
sements relatifs a cela au chapitre 15. 

Classes de caracteres 

Dans une recherche de motif, vous pouvez etablir une correspondance avec tout carac- 
tere qui a — ou n'a pas — une propriete particuliere. II existe quatre manieres de speci- 
fier les classes de caracteres. Vous pouvez specifier une classe de caracteres de la maniere 
traditionnelle en utilisant des crochets et en enumerant les caracteres possibles, ou en 
utilisant l'un des trois raccourcis mnemotechniques : les classes Perl habituelles, les 
nouvelles proprietes Unicode de Perl ou les classes POSIX standard. Chacun de ces rac- 
courcis correspond a un seul caractere de son ensemble. Quantifiez-les si vous voulez fai- 
re une correspondance avec un plus grand nombre d'entre eux, comme \d+ pour 
correspondre a plusieurs chiffres. (Une erreur facile a faire est de croire que \w corres- 
pond a un mot. Utilisez \w+ pour trouver un mot.) 

Classes de caracteres personnalisees 

Une liste de caracteres enumeree entre crochets est appelee une classe de caractere et cor- 
respond a tout caractere dans la liste. Par exemple, [aeiouy] correspond a une voyelle 
(non accentuee). Pour correspondre a un crochet fermant, antislashez-le ou bien placez- 
le en premier dans la liste. 

Des intervalles de caracteres peuvent etre indiques en utilisant un tiret et la notation a- 
z. Plusieurs intervalles peuvent etre combines ; par exemple [0-9a-fA-F]correspond a 
un « chiffre » hexadecimal. Vous pouvez utiliser un antislash pour proteger un tiret qui 
serait sinon interprete comme un delimiteur d'intervalle, ou simplement le placer en 
debut de liste (une pratique probablement moins lisible mais plus traditionnelle). 

Un chapeau (ou accent circonf lexe, ou f leche vers le haut) au debut de la classe de ca- 
ractere l'inverse, la faisant correspondre a tout caractere ne se trouvant pas dans la liste. 
(Pour correspondre a un chapeau, ou bien ne le mettez pas au debut, ou mieux, prote- 
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gez-le avec un antislash.) Par exemple, [ A aeiouy] correspond a tout caractere qui n'est 
pas une voyelle (non accentuee). Cependant soyez prudent avec la negation de classe, 
car l'univers des caracteres est en expansion. Par exemple, cette classe de caractere cor- 
respond aux consonnes — et aussi aux espaces, aux sauts de ligne, et a tout (y compris 
les voyelles) en cyrillique, en grec ou tout autre alphabet, sans compter tous les ideo- 
grammes chinois, japonais et coreens. Et un jour aussi le cirth, le tengwar et le klingon. 
(Mais deja le lineaire B et l'etrusque.) II vaut done peut-etre mieux specifier vos conson- 
nes explicitement, comme [bcdfghjklmnpqrstvwxyz], ou [b-df-hj-np-tv-z] pourfai- 
re plus court. (Cela resout aussi le probleme du « y » qui devrait etre a deux endroits a 
la fois, ce qu'interdit l'utilisation de l'ensemble complementaire.) 

Les metasymboles caracteres normaux, comme \n, \t, \cX, \NNN et \ti{N0M} sont utilisa- 
bles dans une classe de caracteres (voir la section Caracteres specifiques). De plus, vous 
pouvez utiliser \b dans une classe de caracteres pour signifier un espace arriere, exacte- 
ment comme dans une chaine entre apostrophes doubles. Normalement, dans une re- 
cherche de motif, il represente une limite de mot. Mais les assertions de largeur nulle 
n'ont aucun sens dans une classe de caracteres, e'est pourquoi \b retro uve la significa- 
tion qu'il a dans les chaines. Vous pouvez egalement utiliser les classes de caracteres pre- 
definies qui sont decrites plus loin dans ce chapitre (classique, Unicode ou POSIX), mais 
n'essayez pas de les utiliser comme point initial ou final d'un intervalle — cela n'ayant 
pas de sens, le « - » sera interprets comme un caractere litteral. 

Tous les autres metasymboles perdent leur signification speciale quand ils sont entre 
crochets. En particulier, vous ne pouvez utiliser aucun des trois jokers generiques : 
« . », \Xou \C. Le premier surprend souvent, mais cela n'a pas grand sens d'utiliser la 
classe de caractere universelle a l'interieur d'une classe plus restrictive, et de plus vous 
avez souvent besoin de faire une correspondance avec un point litteral dans une classe 
de caractere — quand vous travaillez sur des noms de fichier, par exemple. Cela n'a pas 
grand sens non plus de specifier des quantificateurs, des assertions ou des alternatives 
dans une classe de caracteres, puisque les caracteres sont interpretes individuellement. 
Par exemple, [fee|fie|foe|foo] a exactement la meme signification que [feio|]. 

Raccourcis de classes de caracteres classiques Perl 

Depuis l'origine, Perl a fourni un certain nombre de raccourcis pour les classes de carac- 
teres. La liste est fournie dans le tableau 5-8. Tous sont des metasymboles alphabetiques 
antislashes, et dans chaque cas, la version en majuscule est la negation de la version en 
minuscules. Leur signification est n'est pas aussi rigide que vous pourriez le croire : leur 
sens peut etre influence par les definitions de locales. Meme si vous n'utilisez pas les lo- 
cales, leur signification peut changer a chaque fois qu'un nouveau standard Unicode 
sortira, ajoutant de nouveaux scripts avec de nouveaux chiffres et de nouvelles lettres. 
(Pour conserver l'ancienne signification par octets, vous pouvez toujours utiliser use 
bytes. Voir Proprietes Unicode un peu plus loin dans ce chapitre pour des explications 
sur les correspondances utf8. Dans tous les cas, les correspondances utfB sont un suren- 
semble des correspondances sur les octets.) (Oui, nous savons que la plupart des mots 
ne comportent ni chiffres ni soulignes mais parfois des accents ; \w sert a trouver des 
« mots » au sens des tokens dans un langage de programmation usuel. Ou en Perl.) 
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Tableau 5-8. classe de caracteres classiques 



Symbole 


Signification 


En octets 


Enutf8 


\d 


Chiffire 


[0-9] 


\p{IsDigit} 


\D 


Non chifFre 


[ A 0-9] 


\P{IsDigit} 


\s 


Blanc 


[ \t\n\r\f] 


\p{IsSpace} 


\S 


Non blanc 


[ A \t\n\r\f] 


\P{IsSpace} 


\w 


Caractere de mot 


[a-zA-Z0-9_] 


\p{IsWord} 


\W 


Non-( caractere mot) 


[ A a-zA-Z0-9_] 


\P{IsWord} 



Ces metacaracteres peuvent etre utilises a l'exterieur ou a Finterieur de crochets, c'est-a- 
dire soit par eux-memes ou comme element d'une classe de caracteres : 

if ($var =~ /\D/) { warn "contient des non-chiffres" } 

if ($var =~ /[ A \w\s.]/) { warn "contient des non-(mot, espace, point)" } 



Proprietes Unicode 

Les proprietes Unicode sont disponibles en utilisant \p{PR0P} et son ensemble comple- 
mentaire \P{PR0P}. Pour les rares proprietes qui ont un nom en un seul caractere, les 
accolades sont facultatives, comme dans \pN pour indiquer un caractere numerique (pas 
necessairement decimal — les chiffres remains sont aussi des caracteres numeriques). 
Ces classes de proprietes peuvent etre utilisees par elles-memes ou combinees dans une 
classe de caracteres : 

if ($var =~ / A \p{IsAlpha}+$/) { print "tout alphabetique" } 

if ($var =~ s/[\p{Zl}\p{Zp}]/\n/g) { print "saut de lignes" } 

Certaines proprietes sont directement defmies dans le standard Unicode, et d'autres 
sont des composees definies par Perl, en s'appuyant sur les proprietes standard. II et Zp 
sont des proprietes Unicode standard qui representent les separateurs de lignes et de pa- 
ragraphes, tandis qu'IsAlpha est definie par Perl comme une classe regroupant les pro- 
prietes standard LI, Lu, Lt et Lo (c'est-a-dire les lettres qui sont en majuscules, en 
minuscules, en casse de titre ou autre). A partir de la version 5.6.0 de Perl, vous avez be- 
soin de use utf 8 pour que ces proprietes fonctionnent. Cette restriction sera assouplie 
dans le futur. 

II y a un grand nombre de proprietes. Nous allons lister celles que nous connaissons, 
mais la liste sera forcement incomplete. De nouvelles proprietes sont susceptibles d'ap- 
paraitre dans les nouvelles versions d'Unicode, et vous pouvez meme definir vos pro- 
pres proprietes. Nous verrons cela plus loin. 

Le Consortium Unicode produit les informations que Ton retrouve dans les nombreux 
fichiers que Perl utilise dans son implementation d'Unicode. Pour plus d'informations 
sur ces fichiers, voyez le chapitre 15. Vous pouvez lire un bon resume de ce qu'est Uni- 
code dans le document PATH_T0_PERLLIB/unicodeAJnicode3.html oil PA TH_ T0_ PERL LIB 
est ce qui est affiche par : 

perl -MConfig -le 'print $Conf ig{privlib}' 

La plupart des proprietes Unicode sont de la forme \p{IsPR0P}. Le Is est facultatif, mais 
vous pouvez le laisser pour des raisons de lisibilite. 
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Proprietes Unicode de Perl 

Le tableau 5-9 donne la liste des proprietes composites de Perl. Elles sont definies de fa- 
con a etre raisonnablement proches des definitions POSIX standard pour les classes de 
caracteres. 



Tableau 5-9. Proprietes Unicode composites 



Proprete 


Equivalent 


IsASCII 


[\x00-\x7f ] 


IsAlnum 


[\p{IsLl}\p{IsLu}\p{IsLt}\p{IsLo}\p{IsNd}] 


IsAlpha 


[\p{IsLl}\p{IsLu}\p{IsLt}\p{IsLo}] 


IsCntrl 


\p{IsC} 


IsDigit 


\p{Nd} 


IsGraph 


[ A \pC\p{IsSpace}] 


Is Lower 


\p{IsLl} 


IsPrint 


\P{IsC} 


IsPunct 


\p{IsP} 


IsSpace 


[\t\n\f\r\p{IsZ}] 


IsUpper 


[\ P {IsLu}\p{IsLt}] 


IsWord 


[_\p{IsLl}\p{IsLu}\p{IsLt}\p{IsLo}\p{IsNd}] 


IsXDigit 


[0-9a-fA-F] 



Perl fournit egalement les composites suivants pour chacune des principales categories 
des proprietes Unicode standard (voir la section suivante) : 



Propriete 


Signification 


Normative 


IsC 


Codes de controle et equivalents 


Oui 


IsL 


Lettres 


Partiellement 


IsM 


Marqueurs 


Oui 


IsN 


Nombres 


Oui 


IsP 


Ponctuation 


Non 


IsS 


Symboles 


Non 


IsZ 


Separateurs (Zeparateurs?) 


Oui 



Proprietes Unicode standard 

Le tableau 5-10 donne la liste des proprietes Unicode standard les plus basiques, qui de- 
rivent de la categorie de chaque caractere. Aucun caractere n'est membre de plus d'une 
categoric Certaines proprietes sont normatives ; d'autres sont simplement informati- 
ves. Reportez-vous au standard Unicode pour savoir combien l'information normative 
est normative, et combien l'information informative ne Test pas. 
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Tableau 5-10. Proprietes Unicode standard 



Propriete 


Signification 


Normative 


IsCc 


Autre, controle 


Oui 


IsCf 


Autre, format 


Oui 


IsCn 


Autre, non affecte 


Oui 


IsCo 


Autre, usage prive 


Oui 


IsCs 


Autre, substitut 


Oui 


IsLl 


Lettre, minuscule 


Oui 


IsLm 


Lettre, modificateur 


Non 


IsLo 


Lettre, autre 


Non 


IsLt 


Lettre, casse de titre 


Oui 


IsLu 


Lettre, majuscule 


Oui 


IsMc 


Marque, combinante 


Oui 


IsMe 


Marque, entourant 


Oui 


IsMn 


Marque, non-espacement 


Oui 


IsNd 


Nombre, chiffre decimal 


Oui 


IsNl 


Nombre, lettre 


Oui 


IsNo 


Nombre, autre 


Oui 


IsPc 


Ponctuation, connecteur 


Non 


IsPd 


Ponctuation, tiret 


Non 


IsPe 


Ponctuation, fermeture 


Non 


IsPf 


Ponctuation, guillemet fermant 


Non 


IsPi 


Ponctuation, guillemet ouvrant 


Non 


IsPo 


Ponctuation, autre 


Non 


IsPs 


Ponctuation, ouvert 


Non 


IsSc 


Symbole, monnaie 


Non 


IsSk 


Symbole, modificateur 


Non 


IsSm 


Symbole, math 


Non 


IsSo 


Symbole, autre 


Non 


IsZl 


Separateur, de ligne 


Oui 


IsZp 


Separateur, de paragraphe 


Oui 


IsZs 


Separateur, espace 


Oui 



Un autre ensemble de proprietes utiles est lie au fait qu'un caractere peut etre decom- 
pose (de facon canonique ou compatible) en d'autres caracteres plus simples. La decom- 
position canonique ne perd aucune information de formatage. La decomposition 
compatible peut perdre des informations de formatage, comme le fait de savoir si le ca- 
ractere est en exposant. 
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Propriete 


Information perdue 


IsDecoCanon 


Rien 


IsDecoCompat 


Quelque chose (parmi les suivants) 


IsDCcircle 


Cercle autour du caractere 


IsDCfinal 


Preference de position finale (Arabe) 


IsDCfont 


Preference de variante de fonte 


IsDCfraction 


Caracteristique de fraction ordinaire 


IsDCinitial 


Preference de position initiale (Arabe) 


IsDCisolated 


Preference de position isolee (Arabe) 


IsDCmedial 


Preference de position mediane (Arabe) 


IsDCnarrow 


Caracteristique d'etroitesse 


IsDCnoBreak 


Preference de non-coupure sur un espace ou un tiret 


IsDCsmall 


Caracteristique de petite taille 


IsDCsquare 


Carre autour d'un caractere CJK 


IsDCsub 


Position d'indice 


IsDCsuper 


Position d'exposant 


IsDCvertical 


Rotation (d'horizontal a vertical) 


IsDCwide 


Caracteristique de largeur 


IsDCcompat 


Identite (variable) 


Void quelques proprieties qui interessent les personnes faisant du rendu bidire 


Proprite 


Signification 


IsBidiL 


Gauche a droite (Arabe, Hebreu) 


IsBidiLRE 


Inclusion de gauche a droite 


IsBidiLRO 


Force de gauche a droite 


IsBidiR 


Droite a gauche 


IsBidiAL 


Droite a gauche arabe 


IsBidiRLE 


Inclusion de droite-agauche 


IsBidiRLO 


Force de droite a gauche 


IsBidiPDF 


Depile le format directionnel 


IsBidiEN 


Nombre europeen 


IsBidiES 


Separateur de nombre europeen 


IsBidiET 


Terminateur de nombre europeen 


IsBidiAN 


Nombre arabe 


IsBidiCS 


Separateur de nombres communs 


IsBidiNSM 


Marque de non-espacement 


IsBidiBN 


Limite neutre 


IsBidiB 


Separateur de paragraphe 
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Proprite 


Signification 


IsBidiS 


Separateur de segment 


IsBidiWS 


Blanc 


IsBidiON 


Autres neutres 


IsMirrored 


Image miroir quand utilise de droite a gauche 



Les proprietes suivantes classent differents syllabaires selon les sonorites des voyelles : 



IsSylA 

IsSylAA 

IsSylAAI 

IsSylAI 

IsSylC 



IsSylE 

IsSylEE 

IsSyll 

IsSylll 

IsSylN 



IsSylO 

IsSylOO 

IsSylU 

IsSylV 

IsSylWA 



IsSylWAA 

IsSylWC 

IsSylWE 

IsSylWEE 

IsSylWI 



IsSylWII 

IsSylWO 

IsSylWOO 

IsSylWU 

IsSylWV 



Par exemple, \p{IsSylA} correspondrait a \N{KATAKANA LETTER KA} mais pas a \N{KA- 
TAKANA LETTER KU}. 

Maintenant que nous vous avons parle de toutes ces proprietes Unicode 3.0, nous de- 
vons tout de meme lister quelques unes des plus esoteriques qui ne sont pas implemen- 
tees dans Perl 5.6.0, car cette implementation etait basee en partie sur Unicode 2.0, et 
que des choses comme l'algorithme bidirectionnel etaient encore sur le metier. Cepen- 
dant, comme d'ici a ce que vous lisiez ceci, les proprietes manquantes pourraient bien 
avoir ete implementees, nous les avons listees quand meme. 

Proprietes de bloc Unicode 

Certaines proprietes Unicode sont de la forme \p{InSCRIPT}. (Remarquez la distinction 
entre Is et In.) Les proprietes In servent a tester l'appartenance a des blocs d'un SCRIPT 
unique. Si vous avez un caractere et que vous vous demandez s'il est ecrit en ecriture 
hebraique, vous pouvez le tester avec : 

print "Pour moi c'est de l'Hebreu!\n" if chr(l488) =~ Ap{InHebrew}/; 

Cela fonctionne en verifiant si un caractere est « dans » l'intervalle valide de ce type 
d'ecriture. Cela peut etre inverse avec \P{InSCRIPT} pour savoir si quelque chose n'est 
pas dans un bloc de script particulier, comme \P{InDingbats} pour savoir si une chaine 
contient un caractere non dingbat. Dans les proprietes de bloc on trouve les elements 
suivants : 



InArabic 

InArmenian 

InArrows 

InBasicLatin 

InBengali 

InBopomofo 

InBoxDrawing 

InCherokee 



InCyrillic 

InDevanagari 

InDingbats 

InEthiopic 

InCeorgian 

InGreek 

InGujarati 

InGurmukhi 



InHanguDamo 

InHebrew 

InHiragana 

InKanbun 

InKannada 

InKatakana 

InKhmer 

InLao 



InMalayalam 

InMongolian 

InMyanmar 

InOgham 

InOriya 

InRunic 

InSinhala 

InSpecials 



InSyriac 

InTamil 

InTelugu 

InThaana 

InThai 

InTibetan 

InYiRadicals 

InYiSyllables 



Sans oublier les impressionnants : 

InAlphabeticPresentationForms 

InArabicPresentationForms-A 

InArabicPresentationForms-B 



InHalfwidthandFullwidthForms 

InHangulCompatibilityDamo 

InHangulSyllables 
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InBlockElements 

InBopomofoExtended 

InBraillePatterns 

InCDKCompatibility 

InCDKCompatibility Forms 

InCDKCompatibilityldeographs 

InCDKRadicalsSupplement 

InCDKSymbolsandPunctuation 

InCDKUnifiedldeographs 

InCDKUnifiedldeographsExtensionA 

InCombiningDiacriticalMarks 

InCombiningHalf Marks 

InCombiningMarksforSymbols 

InControlPictures 

InCurrencySymbols 

InEnclosedAlphanumerics 

InEnclosedCDKLettersandMonths 

InCeneralPunctuation 

InGeometricShapes 

InGreekExtended 



InHighPrivateUseSurrogates 
InHighSurrogates 

InldeographicDescriptionCharacters 

InlPAExtensions 

InKangxiRadicals 

InLatin-lSupplement 

InLatinExtended-A 

InLatinExtended-B 

InLatinExtendedAdditional 

InLetterlikeSymbols 

InLowSurrogates 

InMathematicalOperators 

InMiscellaneousSymbols 

InMiscellaneousTechnical 

InNumberForms 

InOpticalCharacterRecognition 
InPrivateUse 

InSuperscriptsandSubscripts 
InSmallFormVariants 
InSpacingModifier Letters 



Et le mot le plus long : 

InUnifiedCanadianAboriginalSyllabics 
Pas mieux. 

Consultez PATH_TO_PERLLIB/unicodeAn/*.pl pour obtenir une liste a jour de toutes ces 
proprietes de blocs de caracteres. Remarquez que les proprietes In ne font que verifier 
si le caractere est dans Fintervalle alloue pour ce script. Rien ne vous garantit que tous 
les caracteres dans cet intervalle sont definis ; vous devrez egalement tester Tune des 
proprietes Is discutees precedemment pour verifier si le caractere est defini. Rien ne 
vous garantit non plus qu'une langue particuliere n'utilise pas des caracteres en dehors 
de Fintervalle qui lui est affecte. En particulier, de nombreuses langues europeennes 
melangent les caracteres latins etendus avec des caracteres Latin-1. 

Mais bon, si vous avez besoin d'une propriete particuliere qui n'est pas fournie, ce n'est 
pas un gros probleme. Continuez a lire. 

Definir vos propres proprietes de caracteres 

Pour definir vos propres proprietes, vous devrez ecrire un sous-programme portant le 
nom de la propriete que vous voulez (voir chapitre 6, Sous-programmes). Le sous-pro- 
gramme doit etre defini dans le paquetage qui a besoin de la propriete, ce qui signifie 
que si vous desirez l'utiliser dans plusieurs paquetages, vous devrez soit Fimporter d'un 
autre module (voir chapitre 11, Modules), ou Fheriter comme methode de classe depuis 
le paquetage dans lequel il est defini (voir chapitre 12, Objets). 

Une fois que cela est fait, le sous-programme doit renvoyer des donnees dans le meme 
format que les fichiers du repertoire PATH_TO_PERLLIB/unicode/Is. C'est-a-dire que vous 
devez juste retourner une liste de caracteres ou des intervalles de caracteres en hexade- 
cimal, un par ligne. S'il y a un intervalle, les deux nombres sont separes par une tabu- 
lation. Supposons que vous vouliez creer une propriete qui serait vraie si votre caractere 
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est dans l'intervalle de l'un des deux syllabaires japonais, nommes hiragana et katakana. 
(Ensemble on les appelle simplement kana.) Vous pouvez juste mettre les deux inter- 
valles comme suit : 

sub InKana { 

return « J END'; 
3040 309F 
30A0 30FF 
END 
} 

Vous pourriez egalement le definir a l'aide de noms de proprietes existantes : 

sub InKana { 

return « J END'; 
+utf8: :InHiragana 
+utf8: :InKatakana 
END 
} 

Vous pouvez aussi faire une soustraction en utilisant un prefixe « - ». Supposons que 
vous ne vouliez que les veritables caracteres, et pas seulement les blocs de caracteres. 
Vous pouvez retirer tous les caracteres indefinis comme ceci : 

sub IsKana { 

return « J END'; 
+utf8: :InHiragana 
+utf8: :InKatakana 
-utf8::IsCn 
END 
} 

Vous pouvez aussi demarrer avec le complement d'un ensemble de caracteres en utili- 
sant le prefixe « ! » : 

sub IsNotKana { 

return « J END'; 
!utf8: :InHiragana 
-utf8: :InKatakana 
+utf8::IsCn 
END 
} 

Perl lui-meme utilise les memes trues pour definir la signification de ses propres classes 
de caracteres « classiques » (comme \w) quand vous les incluez dans vos classes de carac- 
teres personnalisees (comme [-.\w\s]). Vous pourriez penser que plus les regies de- 
viennent compliquees, plus lentement cela tournera ; mais en fait, une fois que Perl a 
calcule le motif de bits pour le bloc de 64 bits de votre propriete, il le memorise pour 
n'avoir jamais a le recalculer. (Cela est fait dans des blocs de 64 bits pour ne mime pas 
avoir a decoder votre utf8 pour faire les recherches.) Ainsi, toutes les classes de caracte- 
res, internes ou personnalisees, tournent toutes a peu pres a la meme vitesse (rapide) 
une fois mises en route. 
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Classes de caracteres de style POSIX 

Contrairement aux autres raccourcis de classes de caracteres, la notation de style POSIX, 
[ : CLASSE : ] , n'est utilisable que pour la construction d'autres classes de caracteres, c'est- 
a-dire a l'interieur d'une autre paire de crochets. Par exemple, / [ . , [ : alpha :][: dig- 
it :]]/ va chercher un caractere qui est soit un point (litteral, car dans une classe de ca- 
racteres), une virgule, ou un caractere alphabetique ou un nombre. 

Les classes POSIX disponibles a partir de la version 5.6 de Perl sont listees dans le tableau 
5-11. 



Tableau 5-11. Classes de caracteres POSIX 



Classe 


Signification 


alnum 


Tout alphanumerique, c'est-a-dire un alpha ou un digit. 


alpha 


Toute lettre. (Cela fait beaucoup plus de lettres que vous pensez, sauf si 
vous pensez en Unicode, auquel cas cela fait quand meme beaucoup.) 


ascii 


Tout caractere avec une valeur numerique comprise entre 0 et 127. 


cntrl 


Tout caractere de controle. En general ce sont des caracteres qui ne produi- 
sent pas d'affichage par eux-memes, mais controlent le terminal d'une 
facon ou d'une autre. Par exemple, les caracteres de nouvelle ligne, de fin 
de page ou d'espace arriere sont des caracteres de controle. Les caracteres 
ayant une valeur numerique inferieure a 32 sont le plus souvent conside- 
red comme des caracteres de controle. 


digit 


Un caractere representant un chiffre decimal, comme ceux entre 0 et 9- 
(Cela comprend d'autres caracteres en Unicode.) Equivalent a \d. 


graph 


Tout caractere alphanumerique ou de ponctuation. 


lower 


Une lettre minuscule. 


print 


Tout caractere alphanumerique, de ponctuation ou d'espacement. 


punct 


Tout caractere de ponctuation. 


space 


Tout caractere d'espacement. Cela inclut tabulation, nouvelle ligne, saut 
de page et retour chariot (et encore beaucoup plus en Unicode). Equiva- 
lent a \s. 


upper 


Tout caractere en majuscule (ou casse de titre). 


word 


Tout caractere d'identificateur, soit un alnum ou un souligne. 


xdigit 


Tout chiffre hexadecimal. Bien que cela semble un peu bete ([0-9a-fA-F] 
marche tres bien), c'est inclus pour etre complet. 



Vous pouvez inverser la classe de caracteres POSIX en prefixant le nom de la classe par 
un A apres le [ : . (C'est une extension apportee par Perl.) Par exemple : 



POSIX 


Classique 


[-digit:] 


\D 


[ : A space: ] 


\S 


[: A word:] 


\W 
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Si le pragma use utf 8 n'est pas demande, mais que le pragma use locale Test, la classe 
correspond directement avec les fonctions equivalentes de Finterface isalpha(3) de la li- 
brairie C (excepte word, qui est une extension Perl correspondant a \w). 

Si le pragma utf 8 est utilise, les classes de caracteres POSIX sont exactement equivalen- 
tes aux proprietes Is listees dans le tableau 5-9. Par exemple, [: lower : ] et \p{ Lower} 
sont equivalentes, sauf que les classes POSIX ne peuvent etre utilisees que dans les clas- 
ses de caracteres construites, tandis que les proprietes Unicode ne sont pas soumises a de 
telles restrictions et peuvent etre utilisees dans des motifs partout ou les raccourcis Perl 
comme \s et \w peuvent l'etre. 

Les crochets font partie de la construction de style POSIX [ : : ] et pas de la classe de ca- 
racteres. Ce qui nous amene a ecrire des motifs tels que / A [ [ : lower : ] [ : digit: ] ]+$/ 
pour correspondre a une chaine consistant entierement de lettres minuscules ou de 
chiffres (avec un saut de ligne final facultatif). En particulier, ceci ne fonctionne pas : 

42 =~ / A [:digit:]+$/ # FAUX 

Cela est du au fait qu'on n'est pas dans une classe de caracteres. Ou plutot, c'est une classe 
de caracteres, celle qui represente les caracteres « : », « i », « t », « g » et « d ». Perl se 
moque du fait que vous ayez utilise deux « : » (et deux « i »). 

Voici ce dont vous avez en fait besoin : 

42 =~ /*[[:digit:]]+$/ 

Les classes de caracteres POSIX [ .cc. ] et [=cc=] sont reconnues, mais produisent une 
erreur indiquant qu'elles ne sont pas utilisables. L'utilisation de n'importe quelle classe 
de caracteres POSIX dans une version de Perl plus ancienne ne marchera pas, et de facon 
probablement silencieuse. Si vous comptez utiliser les classes de caracteres POSIX, il est 
preferable d'imposer l'utilisation d'une nouvelle version de Perl en ecrivant : 

use 5.6.0; 

Quantificateurs 

A moins que vous n'en decidiez autrement, chaque element d'une expression reguliere 
ne correspond qu'une fois a quelque chose. Avec un motif comme /nop/, chacun de ces 
caracteres doit correspondre, Fun a la suite de l'autre. Les mots comme « panoplie » ou 
« xenophobie » marchent bien, car oil la correspondance se fait n'a aucune importance. 

Si vous vouliez trouver a la fois « xenophobie » et « Snoopy », vous ne pourriez pas uti- 
liser le motif /nop/, puisque cela requiert qu'il n'y ait qu'un seul « o » entre le « n » et 
le « p », et que Snoopy en a deux. C'est ici que les quantificateurs montrent leur utilite : 
ils indiquent combien de fois quelque chose peut correspondre, au lieu de une fois par 
defaut. Les quantificateurs dans une expression reguliere sont comme les boucles dans 
un programme ; en fait, si vous regardez une expression reguliere comme un program- 
me, alors ce sont des boucles. Certaines boucles sont exactes, comme « repete cette cor- 
respondance cinq fois seulement» ({5}). D'autres vous donnent a la fois la limite 
inferieure et la limite superieure du nombre de correspondances, comme « repete ceci 
au moins deux fois, mais pas plus de quatre » ({2,4}). D'autres n'ont pas de limite su- 
perieure du tout, comme « trouve ceci au moins deux fois, mais ensuite autant de fois 
que tu veux » ({2, }). 
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Le tableau 5-12 liste les quantificateurs que Perl reconnait dans un motif. 



Tableau 5-12. Comparaison des quantificateurs de motifs 



IVldAllllUlll 


1V1 1111111 Lllll 


1 IdgC alllUl I3CC 


{MIN,MAX} 


{MIN, MAX}? 


Doit apparaitre au moins MIN fois mais pas plus de MAX fois 


{MIN, } 


{MIN,}? 


Doit apparaitre au moins MIN fois 


{COMPTE} 


{COMPTE}? 


Doit apparaitre exactement COMPTE fois 


* 


*? 


0 ou plus (comme {0, }) 


+ 


+? 


1 fois ou plus (comme {l, }) 


? 


?? 


0 ou 1 fois (comme {0,1}) 



Quelque chose suivi d'une * ou d'un ? n'est pas oblige de correspondre a tout prix. C'est 
parce que cela peut correspondre 0 fois et to uj ours etre considere comme un succes. Un 
+ est souvent un meilleur choix, car l'element recherche doit etre present au moins une 
fois. 

Ne vous laissez pas embrouiller par l'emploi de « exactement » dans le tableau prece- 
dent. II ne fait reference qu'au nombre de repetitions, et pas a la chaine complete. Par 
exemple, $n =~ Ad{3}/ ne dit pas « est-ce que cette chaine fait exactement trois chiffres 
de long ? ». En fait le motif se preoccupe de savoir s'il existe une position dans $n a la- 
quelle trois chiffres apparaissent les uns a la suite des autres. Des chaines comme « 101 
rue de la Republique » correspondent, tout comme des chaines telles que « 75019 » ou 
« 0 825 827 829 ». Toutes contiennent trois chiffres a la suite a un ou plusieurs endroits, 
ce qui est tout ce que vous demandiez. Voir dans la section Positions l'utilisation des as- 
sertions de position (comme dans / A \d{3}$/) pour preciser votre recherche. 

Si on leur donne la possibilite de correspondre un nombre variable de fois, les quanti- 
ficateurs maximaux vont essayer de maximiser le nombre de repetitions. C'est pourquoi 
quand nous disons « autant de fois que tu veux », les quantificateurs gourmands le com- 
prennent comme « le plus de fois que tu le peux », a la seule condition que cela n'em- 
peche pas des specifications plus loin dans l'expression de correspondre. Si un motif 
contient deux quantificateurs ouverts, les deux ne peuvent evidemment pas consom- 
mer l'integralite de la chaine : les caracteres utilises par la premiere partie de l'expres- 
sion ne sont plus disponibles pour la partie qui suit. Chaque quantificateur est 
gourmand aux depens de ceux qui le suivent, en lisant le motif de gauche a droite. 

C'est du moins le comportement traditionnel des quantificateurs dans les expressions 
regulieres. Cependant Perl vous permet de modifier le comportement de ses quantifi- 
cateurs : en mettant un ?apres un quantificateur, vous le transformez de maximal en mi- 
nimal. Cela ne signifie pas qu'un quantificateur minimal va toujours correspondre au 
nombre minimum de repetitions permises par ses specifications, pas plus qu'un quan- 
tificateur maximal correspond toujours au plus grand nombre defini dans ses specifica- 
tions. La correspondance globale doit toujours se faire, et le quantificateur minimal 
prendra juste ce qu'il faut pour que ce soit un succes, et pas plus. (Les quantificateurs 
minimaux preterent la satisfaction a la gourmandise.) 

Par exemple dans la correspondance : 

"exigence" =~ /e(.*)e/ # $1 vaut maintenant "xigenc" 
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le .* correspond a « xigenc », la plus longue chaine possible a laquelle il peut corres- 
pondre. (II stocke egalement cette valeur dans $1, comme cela est explique dans la sec- 
tion Capture et regroupement plus loin dans ce chapitre.) Bien qu'une correspondance 
plus courte fut possible, un quantificateur gourmand s'en moque. S'il a le choix entre 
deux possibilites a partir de la meme position, il retournera toujours la plus longue des 
deux. 

Comparez ceci avec cela : 

"exigence" =~ /e(.*?)e/ # $1 vaut maintenant "xig" 

Ici, c'est la version minimale, .*?, qui est utilisee. L'ajout du ? a P* fait que *? a un com- 
portement oppose : ayant le choix entre deux possibilites a partir du meme point, il 
prend toujours la plus courte des deux. 

Bien que vous puissiez lire *? comme une injonction a correspondre a zero ou plus de 
quelque chose en preferant zero, cela ne veut pas dire qu'il correspondra toujours a zero 
caractere. Si c'etait le cas ici, par exemple, et qu'il laissait $1 a la valeur " " , alors le second 
« e » ne serait pas trouve, puisqu'il ne suit pas immediatement le premier. 

Vous pourriez aussi vous demander pourquoi, alors qu'il cherchait une correspondance 
minimale avec /e(.*?)e/, Perl n'a pas plutot mis « nc » dans $1. Apres tout, « nc » se 
trouve lui aussi entre deux e et est plus court que « xig ». En Perl, le choix mini- 
mal/maximal se fait seulement lorsqu'on recherche la plus courte ou la plus longue par- 
mi plusieurs correspondances ayant toutes le meme point de depart. Si plusieurs 
correspondances possibles existent, mais commencent a des endroits differents dans la 
chaine, alors leurs longueurs n'ont aucune importance — pas plus que le fait que vous 
ayez utilise un quantificateur minimal ou maximal. La premiere de plusieurs corres- 
pondances possibles est toujours preponderante devant celles qui la suivent. C'est seu- 
lement lorsque plusieurs correspondances possibles demarrent du meme point dans la 
chaine que le cote minimal ou maximal de la correspondance sert a les departager. Si 
les points de depart sont differents, il n'y a rien a departager. Les correspondances de 
Perl sont normalement de type la plus a gauche la plus longue ; avec une correspondance 
minimale, cela devient la plus a gauche la plus courte. Mais la partie la plus a gauche ne 
change pas et reste le critere dominant. 8 

II y a deux manieres de passer l'orientation a gauche du detecteur de motif. Premiere- 
ment vous pouvez utiliser un quantificateur gourmand au debut (typiquement .*) 
pour essayer de consommer le debut de la chaine. En cherchant la correspondance pour 
un quantificateur gourmand, il essaie d'abord la correspondance la plus longue ce qui 
provoque effectivement une recherche de droite a gauche dans le reste de la chame : 

"exigence" =~ /.*e(.*?)e/ # $1 vaut maintenant "nc" 

Mais faites attention avec cette methode, car la correspondance complete contient 
maintenant toute la chaine jusqu'a ce point. 



8. Tous les moteurs de regex ne fonctionnent pas comme cela. Certains croient plutot en la 
gourmandise globale, oil la correspondance la plus longue gagne toujours, meme si elle apparait 
plus tard dans la chaine. Perl ne fonctionne pas comme cela. Vous pourriez dire que l'ardeur 
prime sur la gourmandise (ou le rationnement). Pour une discussion plus formelle de ce principe 
et de beaucoup d'autres, voir la section « Le petit Moteur qui/(ne )?pouvait( pas)?/ ». 
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La seconde maniere de defaire cette inclination a gauche est d'utiliser les assertions de 
position, qui sont discutees dans la section suivante. 

Positions 

Certaines constructions de regex representent des positions dans la chaine a traiter, qui 
est juste un emplacement a gauche ou a droite d'un veritable caractere. Ces metasym- 
boles sont des exemples d'assertions de largeur nulle. Nous les appellerons souvent sim- 
plement « assertions ». (On les connait aussi sous le nom d'« ancres », car elles lient 
une partie du motif a une position particuliere.) 

Vous pouvez toujours manipuler les positions dans une chaine sans utiliser de motif La 
fonction integree substr vous permet d'extraire et d'affecter des sous-chaines, calculees 
a partir du debut de la chame, de la fin de la chaine ou a partir d'une position numeri- 
que particuliere. C'est juste ce dont vous avez besoin si vous travaillez avec des enregis- 
trements de longueur fixe. Les motifs deviennent necessaries quand un decalage 
numerique n'est plus suffisant. Et la plupart du temps, les decalages ne sont pas suffi- 
sants — disons pas suffisament commodes, par rapport aux motifs. 

Les debuts : assertions \A et A 

L'assertion \A correspond seulement au debut de la chaine, quelles que soient les cir- 
constances. Cependant l'assertion A est l'assertion traditionnelle de debut de ligne, ainsi 
que celle de debut de chame. C'est pourquoi si le motif utilise le modificateur /m 9 et que 
la chaine contient des sauts de ligne, A correspond egalement n'importe oil dans la chai- 
ne immediatement apres un caractere de saut de ligne : 

AAbar/ # Correspond a "bar" et "barbecue" 
/ A bar/ # Correspond a "bar" et "barbecue" 

/ A bar/m # Correspond a "bar" et "barbecue" et "zinc\nbar" 

Utilisee en meme temps que /g, le modificateur /m permet a A de correspondre plu- 
sieurs fois dans la meme chaine : 

s/ A \s+//gm; # Supprime les blancs en tete de chaque ligne 

$total++ while / A ./mg; # Compte les lignes qui ne sont pas vides 

Fins : assertions \z, \Z et $ 

Le metasymbole \z correspond a la fin de la chaine, quoi qu'il y ait a l'interieur. \Z cor- 
respond juste avant le saut de ligne en fin de chaine s'il y en a un, ou a la fin s'il n'y en 
a pas. Le metacaractere $ signifie en general la meme chose que \Z. Cependant, si le mo- 
dificateur /m a ete specifie et que la chaine contient des sauts de ligne, alors $ peut aussi 
correspondre n'importe oil dans la chaine, juste avant un saut de ligne : 

/bot\z/ # Correspond avec "robot" 

/bot\Z/ # Correspond avec "robot" et "poulbot\n" 



9. Ou si vous avez mis la variable obsolete $* a 1 et que vous n'ignorez pas $* avec le modifica- 
teur /s. 
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/bot$/ 
/bot$/m 



# Correspond avec "robot" et "poulbot\n" 

# Correspond avec "robot" et "poulbot\n" et "robot\nmenager 



/ A robot$/ 
/ A robot$/m 
AArobotNZ/ 
/\Arobot\z/ 



# Correspond avec "robot" et "robot\n" 

# Correspond avec "robot" et "robot\n" et "ce\nrobot\n" 

# Correspond avec "robot" et "robot\n" 

# Correspond avec "robot" uniquement -- mais pourquoi ne 
#pas avoir utilise eq ? 



Tout comme avec A , le modificateur /mpermet a $ de correspondre plusieurs fois dans la 
meme chaine quand il est utilise avec /g. (Ces exemples supposent que vous avez lu un 
enregistrement multiligne dans $_, par exemple en mettant $/ a " " avant la lecture.) 

s/\s*$//gm; # Supprime les blancs en fin de chaque ligne du paragraphe 

while (/ A ([ A :]+):\s*(.*)/gm ) { # obtient les en-tetes de mail 
$headers{$l} = $2; 



Plus loin dans ce chapitre, a la section Interpolation de variables, nous discuterons de la 
facon dont vous pouvez interpoler des variables dans des motifs : si $toto vaut « be », 
alors /a$toto/ est equivalent a /abc/. Ici, le $ ne correspond pas a la fin de la chaine. 
Pour qu'un $ corresponde a la fin de la chaine, il doit etre a la fin du motif ou etre im- 
mediatement suivi d'une barre verticale ou d'une parenthese fermante. 

Limites : assertions \b et \B 

L'assertion \b correspond a toute limite de mot, celle-ci etant definie comme la position 
entre un caractere \w et un caractere \W, dans n'importe quel ordre. Si l'ordre est \W\w 
e'est la limite en debut de mot, et si l'ordre est \w\W e'est la limite en fin de mot. (Une 
extremite de chaine compte comme un caractere \W ici.) L'assertion \B correspond a tou- 
te position qui n'est pas une limite de mot, e'est-a-dire au milieu de \w\w ou de \W\W 

AbestW # correspond a "ce qu'il est" et "a l'est d'Eden" 

/\Best\B/ # correspond a "zeste" et "intestin" 

/\best\B/ # correspond a "estival" et "il t'estime" 

/\Best\b/ # correspond a "al et "ouest puis nord" 

Comme \W comprend tous les caracteres de ponctuation, (sauf le souligne), il y a des li- 
mites \b au milieu de chames comme « aujourd'hui », « booktech@oreilly.com », 
« S.N.C.F. » et « cle/valeur ». 

A l'interieur d'une classe de caracteres ([\b]), un \b represente un caractere espace ar- 
riere plutot qu'une limite de mot. 

Reconnaissance progressive 

Utilisee avec le modificateur /g, la fonction pos vous permet de connaitre ou de modi- 
fier la position a partir de laquelle la prochaine comparaison progressive commencera : 

$voleur = "Bilbon Baggins"; 
while ($voleur =~ /b/gi) { 

printf "Trouve un B en %d\n", pos($voleur)-l; 

} 



} 
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(Nous retirons un de la position car c'est la longueur de la chame que nous voulions, 
alors que pos renvoie toujours la position juste apres la fin de la reconnaissance prece- 
dente.) 

Le code ci-dessus affiche : 

Trouve un B en 0 
Trouve un B en 3 
Trouve un B en 7 

Apres un echec, la position de reconnaissance est normalement remise a zero. Si vous 
utilisez le modificateur /c (pour « continue »), alors quand le /g se termine, l'echec de 
la reconnaissance ne reinitialise pas le pointeur de position. Cela vous permet de conti- 
nuer votre recherche au-dela de ce point, sans recommencer a partir du debut. 

$voleur = "Bilbon Baggins"; 

while ($voleur =~ /b/gci) { # AJOUT DE /c 

printf "Trouve un B en %d\n", pos($voleur)-l; 

} 

while ($voleur =~ /i/gi) { 

printf "Trouve un I en %d\n", pos($voleur)-l; 

} 

En plus des trois B trouves precedemment, Perl indique maintenant qu'il a trouve un i 
a la position 11. Sans le /c, la seconde boucle de reconnaissance aurait recommence de- 
puis le debut de la chame et d'abord trouve un autre i a la position 1. 

La oil vous en etiez : assertion \G 

Des que vous commencez a ref lechir en termes de la fonction pos, il est tentant de com- 
mencer a creuser dans votre chame a coups de substr, mais c'est rarement la bonne cho- 
se a faire. La plupart du temps, si vous avez commence avec une recherche de motif, 
vous devriez continuer avec une recherche de motif. Cependant, si vous recherchez une 
assertion de position, c'est probablement \G qu'il vous faut. 

L'assertion \C represente a l'interieur du motif le meme point que pos represente a l'ex- 
terieur. Quand vous faites une recherche progressive avec le modificateur /g (ou que 
vous avez utilise la fonction pos pour selectionner directement le point de depart), vous 
pouvez utiliser \C pour specifier la position qui suit la fin de la reconnaissance prece- 
dente. C'est-a-dire qu'il reconnait la position immediatement avant le caractere qui se- 
rait identifie par pos. Cela vous permet de vous souvenir ou vous en etiez : 

($recette = «'DISH') =~ s/ A \s+//gm; 
# Anchois sauce Roswel 
Prechauffer le four a 451 cleg, fahrenheit. 
Melanger 1 ml. de dilithium avec 3 oz. de 
NaCl et y plonger 4 anchois. Glacer avec 
1 gr. de mercure. Faire cuire 4 heures et 
laisser refroidir 3 secondes. Pour 10 martiens. 

DISH 

$recette =~ Ad+ /g; 

$recette =~ /\C(\w+)/; # $1 vaut "deg" 
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$recette =~ /\d+ /g; 

$recette =~ AG(\w+)/; 

$recette =~ /\d+ /gj 

$recette =~ AG(\w+)/; 



# $1 vaut "ml 



# $1 vaut "gr 



Le metasymbole \C est souvent utilise dans une boucle, comme nous allons le monrer 
dans notre prochain exemple. Nous faisons une « pause » apres chaque suite de chiffres, 
et a cette position, nous testons s'il y a une abreviation. Si oui, nous recuperons les deux 
mots qui suivent. Sinon, nous recuperons seulement le mot suivant : 



while ( $recette =~ /(\d+) /g ) { 
my $quantite = $1; 

if ($recette =~ / \G (\w{0,3» \. \s+ de \s+ (\w+) /x) { # abrev. + mot 

print "$quantite $1 de $2\n"; 
} else { 

$recette =~ / \G (\w+) /x; # juste un mot 

print "$quantite $l\n"; 

} 

} 

Ce qui donne : 
451 deg 

1 ml de dilithium 

3 oz de NaCl 

4 anchois 

1 gr de mercure 
4 heures 
3 secondes 
10 martiens 



Les motifs vous permettent de regrouper des portions de votre motif dans des sous-mo- 
tifs et de vous souvenir des chaines reconnues par ces sous-motifs. Nous appellerons le 
premier comportement regroupement et le second capture. 



Pour capturer une sous-chaine pour une utilisation ulterieure, mettez des parentheses 
autour du motif qui la reconnait. La premiere paire de parentheses stocke sa sous-chai- 
ne dans $1, la deuxieme paire dans $2 et ainsi de suite. Vous pouvez utilisez autant de 
parentheses que vous voulez ; Perl continuera a definir des variables numerotees pour 
que vous puissiez representer ces chames capturees. 

Quelques exemples : 

/(\d)(\d)/ # Trouve deux chiffres, qui sont captures dans $1 et $2 
/(\d+)/ # Trouve un ou plusieurs chiffres, captures ensemble dans $1 
/(\d)+/ # Trouve un chiffre une fois ou plus, et capture le dernier dans $1 

Remarquez la difference entre le deuxieme et le troisieme motifs. La deuxieme forme 



pos($recette) = 0; 



# Par securite, initialise \G a 0 



Capture et regroupement 



Capture 



Capture et regroupement 
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est en general ce que vous voulez. La troisieme forme ne cre'epas plusieurs variables pour 
plusieurs chiffres. Les parentheses sont numerotees quand le motif est compile, pas 
quand il est utilise. 

Les chaines capturees sont souvent appelees references arrieres car elles font reference a 
des parties du texte situees en arriere par rapport a la position courante. II existe en fait 
deux manieres d'utiliser ces references arrieres. Les variables numerotees que vous avez 
vues donnent acces en dehors du motif aux references arrieres, mais a l'interieur du mo- 
tif, cela ne marche pas. Vous devez utiliser \1, \2, etc. 10 Pour trouver les mots doubles 
comme « le le » ou « est est », vous pourriez utilisez ce motif : 

Ab(\w+) \l\b/i 

Mais la plupart du temps, vous utiliserez la forme $1, car en general on applique un mo- 
tif, pour ensuite faire quelque chose des sous-chaines. Supposons que vous ayez du texte 
(des en-tetes de mail) qui ressemble a ca : 

From: gnat@perl.com 

To: camelot@oreilly.coin 

Date: Mon, 17 Jul 2000 09:00:00 -1000 

Subject: Eye of the needle 

et que vous vouliez construire un hachage qui fasse le lien entre le texte avant les deux- 
points et celui apres. Si vous boucliez sur ce texte ligne a ligne (par exemple parce que 
vous lisez un fichier), vous pourriez faire comme suit : 

while (<>) { 

/ A (.*?): (.*)$/; # Texte avant les deux-points dans $1, apres dans $2 
$champs{$l} = $2; 

} 

Comme $" , $& et ces variables numerotees sont a portee dynamique jusqu'a la fin du 
bloc ou de la chame eval englobant, ou jusqu'a la prochaine recherche de motif reussie, 
selon lequel se produit le premier. Vous pouvez egalement les utiliser dans la partie 
droite (la zone de remplacement) d'une substitution : 

s/ A (\S+) (\S+)/$2 $1/; # Intervertit les deux premiers mots 

Les regroupements peuvent s'emboiter, et quand ils le font, les groupes sont comptes 
par l'ordre de leurs parentheses ouvrantes. Done, si on donne la chaine « Primula 
Brandebouc » au motif : 

/ A ((\w+) (\w+))$/ 

il capturerait « Primula Brandebouc » dans $1, « Primula » dans $2, et « Brandebouc » 
dans $3. Cela est decrit a la figure 5-1. 



10. Vous ne pouvez pas utiliser $1 pour une reference arriere a l'interieur d'un motif, car il aurait 
deja ete interpole au moment oil la regex a ete compilee. C'est pourquoi nous utilisons la nota- 
tion traditionnelle \1 pour les references arrieres a l'interieur d'un motif. Pour les references a 
deux ou trois chiffres, il y a une ambiguite avec la notation octale des caracteres, mais c'est fine- 
ment resolu en regardant combien de motifs captures sont disponibles. Par exemple, si Perl voit 
un metasymbole \11, c'est equivalent a $11 seulement s'il y a au moins 11 sous-chaines captures 
plus tot dans le motif. Sinon c'est equivalent a \011, e'est-a-dire un caractere de tabulation. 
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/ A ((\^y (^wjo)$7 



$2 



*$3 



$1 



Figure 5-1. Creation de references arrieres avec des parentheses 

Les motifs avec capture sont souvent utilises en contexte de liste pour remplir une liste 
de valeurs, car le motif est assez malin pour retourner les sous-chaines comme une liste : 

($premier, $dernier) = / A (\w+) (\w+)$/; 

($tout, $premier, $dernier) = / A ((\w+) (\w+))$/; 

Avec le modificateur /g, un motif peut renvoyer plusieurs sous-chaines issues de plu- 
sieurs correspondances, le tout dans une seule liste. Supposons que vous ayez Fen-tete 
que nous avons vu precedemment dans une seule chaine (disons dans $_). Vous pour- 
riez faire la meme chose que notre boucle ligne a ligne avec une seule instruction : 

%champs = / A (.*?): (.*)$/gm; 

Le motif reussit quatre fois, et a chaque fois il trouve deux sous-chames. La recherche 
/gm retourne l'ensemble comme une liste plate de huit chames, que Faffectation de liste 
a %champs interpretera comme quatre couples cle/valeur, ramenant ainsi Fharmonie 
dans Funivers. 

Plusieurs autres variables speciales traitent du texte capture dans des recherches de mo- 
tif. $& contient la chaine trouvee dans son ensemble, $~ tout ce qui est a gauche de la 
correspondance, $' tout ce qui est a droite. $+ garde le contenu de la derniere reference 
arriere. 

$_ = "Parlez, <EM>ami</EM>, et entrez."; 

m[ (<.*?>) (.*?) (</.*?>) ]x; # Une balise, du texte, et une balise de 
fin 

print "prematch: $~\n"; # Parlez, 

print "match: $&\n"; # <EM>ami</EM> 

print "postmatch: $'\n"; # , et entrez. 

print "lastmatch: $+\n"; # </EM> 

Pour plus d'explication sur ces variables elfiques magiques (et pour savoir comment les 
ecrire en anglais), voir le chapitre 28, Noms speciaux. 

Le tableau @- (@LAST_MATCH_START) contient les positions des debuts de chacunes des 
correspondances, et @+ (@LAST_MATCH_END) contient les positions de leurs fins : 

#!/usr/bin/perl 

$alphabet = "abcdefghijklmnopqrstuvwxyz"; 
$alphabet =~ /(hi).*(stu)/; 



print "La recherche complete a commence en $-[0] et s'est terminee en 
$+[0]\n"; 
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print "La premiere recherche a commence en $-[l] et s'est terminee en 
$+[l]\n"; 

print "La deuxieme recherche a commence en $-[2] et s'est terminee en 
$+[2]\n"; 

Si vous voulez trouver une parenthese litterale plutot que de l'interpreter comme un 
metacaractere, antislashez-la : 

A(p.e., .*?\)/ 

Ceci trouve un exemple entre parentheses (p.e., celui-ci). Mais comme le point est un 
joker, cela trouve aussi toute phrase entre parentheses dont la premiere lettre est un p 
et la troisieme un e (pied, par exemple). 

Regroupement 

Les parentheses simples regroupent et capturent a la fois. Mais parfois vous n'en deman- 
dez pas tant. Parfois vous voulez juste regrouper des portions du motif sans creer de re- 
ference arriere. Vous pouvez utiliser une forme etendue de parentheses pour supprimer 
la capture : la notation ( ? : PATTERN) va regrouper sans capturer. 

II y a au moins trois raisons pour lesquelles vous voudrez regrouper sans capturer : 

1. Pour quantifier quelque chose. 

2. Pour limiter la portee d'une alternative ; par exemple, / A chat | chien | vache$/ aura 
besoin d'etre ecrit / A (?:chat | chien | vache)$ si vous ne voulez pas que le chat file 
avec le A . 

3. Pour limiter la portee d'un modificateur de motif a un sous-motif specif ique, 
comme dans /toto(?-i:Attention_A_La_Casse)titi/i. (Voir la section suivante, 
Modificateurs cloitres.) 

De plus, il est plus efficace de supprimer la capture de quelque chose que vous n'allez 
pas utiliser. En revanche, la notation est un peu moins lisible. 

Dans un motif, une parenthese ouvrante immediatement suivie d'un point d'interroga- 
tion indique une extension de regex. Le bestiaire actuel des expressions regulieres est re- 
lativement fixe — nous n'osons pas creer un nouveau metacaractere, de peur de casser 
d'anciens programmes Perl. Au lieu de cela, la syntaxe d'extension permet d'ajouter de 
nouvelles fonctionnalites au bestiaire. 

Dans le reste du chapitre, nous allons voir beaucoup d'autres extensions de regex, les- 
quelles feront toutes du regroupement sans capture, avec quelque chose d'autre. L'exten- 
sion ( ? :MOTIF) est speciale en ce qu'elle ne fait rien d'autre. Done si vous ecrivez : 

@champs = split(Ab(?:a | b | c)\b/) 

e'est comme : 

@champs = split(/\b(a | b | c)\b/) 

sauf que cela ne renvoie pas de champs supplementaires. (L'operateur split est un peu 
comme m//g en ce qu'il retournera des champs supplementaires pour chaque chaihe 
capturee dans le motif. D'ordinaire, split ne retourne que ce qui n'a pas ete trouve. 
Pour en savoir plus sur split, voir le chapitre 29.) 
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Modificateurs cloitres 

Vous pouvez cloitrer les modificateurs /i, /m, /s et /x dans une portion de votre motif 
en les inserant (sans le slash) entre le ? et le : de la notation de regroupement. Si vous 
ecrivez : 

/Harry (?i:s) Truman/ 

cela correspondra a la fois a « Harry S Truman » et a « Harry s Truman », tandis que : 

/Harry (?x: [A-Z] \.? \s )?Truman/ 

correspondra a la fois a « Harry S Truman » et « Harry S. Truman », aussi bien qu'a 
« Harry Truman », et : 

/Harry (?ix: [A-Z] \.? \s )?Truman/ 
trouvera les cinq, en combinant les modificateurs /i et /x dans le cloitre. 
Vous pouvez egalement soustraire des modificateurs d'un cloitre avec un signe moins : 

/Harry (?x-i: [A-Z] \.? \s )?Truman/i 

Ceci trouve le nom dans toutes les combinaisons de majuscules et minuscules — mais 
si Pinitiale centrale est fournie, elle doit etre en majuscules, car le /i applique au motif 
dans son ensemble est suspendu a l'interieur du cloitre. 

En omettant les deux-points et le MOTIF, vous pouvez exporter les reglages des modifica- 
teurs a un regroupement exterieur, en le transformant en cloitre. C'est-a-dire que vous 
pouvez selectivement activer ou desactiver les modificateurs pour le regroupement qui 
se trouve un niveau a Pexterieur des parentheses du modificateur, comme ceci : 

/(?i)toto/ # Equivalent a /toto/i 

/toto((?-i)titi)/i # "titi" doit etre en minuscules 
/toto((?x-i) titi)/ # Active /x et desactive /i pour "titi" 

Remarquez que le deuxieme et le troisieme exemples creent des references arrieres. Si 
ce n'etait pas ce que vous vouliez, alors vous auriez du utiliser respectivement (?-i: ti- 
ti) et (?x-i: titi). 

Activer les modificateurs sur une partie de votre motif est particulierement utile quand 
vous voulez que « . » corresponde a des sauts de ligne dans une partie de votre motif, 
mais pas dans le reste. Activer /s sur tout le motif ne vous sera d'aucune utilite dans ce 
cas. 

Alternative 

A l'interieur d'un motif ou d'un sous-motif, utilisez le metacaractere | pour specifier un 
ensemble de possibilites dont chacune peut correspondre. Par exemple : 

/Gandalf | Saroumane | Radagaste/ 

correspond a Gandalf, Saroumane ou Radagaste. L'alternative s'etend seulement jus- 
qu'aux parentheses qui l'entourent les plus proches (qu'elles capturent ou non) : 

/perc | 1 | s | tes/ # Trouve perc, 1, s ou tes 
/per(c|l|s|t)es/ # Trouve perces, perles, perses ou pertes 
/per(?:c|l|s|t)es/ # Trouve perces, perles, perses ou pertes 
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La deuxieme et la troisieme formes correspondent aux mimes chaines, mais la deuxie- 
me capture le caractere changeant, tandis que la troisieme ne le fait pas. 

Dans toutes les positions, le Moteur essaie de trouver le premier element de l'alternati- 
ve, puis le deuxieme, et ainsi de suite. La longueur de chaque element n'a pas d'impor- 
tance, ce qui signifie que dans ce motif : 

/(Sam|Samsagace)/ 

$1 ne vaudra jamais Samsagace, quelle que soit la chaine sur laquelle on l'utilise, car Sam 
sera toujours trouve en premier. Quand vous avez des recherches qui se superposent 
comme ceci, mettez les plus longues au debut. 

Mais l'ordre des elements de l'alternative n'a d'importance qu'a une position donnee. 
La boucle externe du Moteur fait une recherche de gauche a droite, c'est pourquoi ce 
qui suit trouve toujours le premier Sam : 

"'Sam je suis,' dit Samsagace" =~ /(Samsagace | Sam)/; # $1 eq "Sam" 

Mais vous pouvez forcer une recherche de droite a gauche en utilisant les quantifica- 
teurs gourmands, comme nous l'avons vu precedemment dans Quantificateurs : 

'"Sam je suis/ dit Samsagace" =~ /.*(Samsagace|Sam)/; # $1 eq "Samsagace" 

Vous pouvez defaire toute recherche gauche a droite (ou de droite a gauche) en incluant 
n'importe laquelle des assertions de position vues precedemment, comme \G, A et $. Ici 
nous ancrons le motif a la fin de la chaine : 

'"Sam je suis/ dit Samsagace" =~ /(Samsagace | Sam)$/; # $1 eq "Samsagace" 

Cet exemple met le $ en facteur en dehors de l'alternative (car nous avions deja une pai- 
re de parentheses en dehors de laquelle le mettre), mais en l'absence de parentheses 
vous pouvez egalement distribuer les assertions sur tout ou partie des elements de l'al- 
ternative, selon comment vous voulez qu'ils trouvent. Ce petit programme affiche les 
lignes qui commencent par un token DATA ou END : 

#!/usr/bin/perl 
while (<>) { 

print if / A DATA | A END / ; 

} 

Mais faites attention avec cela. Souvenez-vous que le premier et le dernier elements de 
l'alternative (avant le premier | et apres le dernier) ont tendance a avaler les autres de 
chaque cote, sauf s'il y a des parentheses autour. Une erreur courante est de demander : 

/ A chat|chien|vache$/ 

quand vous voulez en fait : 

/ A (chat | chien | vache)$/ 

La premiere trouve « chat » au debut de la chaine, ou « chien » n'importe oil, ou bien 
« vache » en fin de chaine. La deuxieme trouve n'importe quelle chaine consistant sim- 
plement de « chat », « chien » ou « vache ». Elle capture egalement $1, ce qui n'est pas 
forcement ce que vous voulez. Vous pouvez egalement ecrire : 

/ A chat$ | A chien$ | A vache$/ 

Nous vous montrerons une autre solution plus loin. 

Un element de l'alternative peut etre vide, auquel cas il reussit toujours. 
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/com(posite | )/; # Trouve "composite" ou "com" 
/com(posite(s | ) | )/; # Trouve "composites" , "composite" ou "com" 

Cela revient a utiliser le quantificateur ?, qui trouve 0 ou 1 fois : 

/com(posite)?/; # Trouve "composite" ou "com" 
/com(posite(s?)) ?/; # Trouve "composites" , "composite" ou "com" 
/com(posites?)?/; # Pareil, mais n'utilise pas $2 

II y a cependant une difference. Quand vous appliquez le ? a un sous-motif qui fait une 
capture dans une variable numerotee, cette variable sera indefinie s'il n'y a pas de chai- 
ne a y mettre. Si vous avez mis l'element vide dans l'alternative, elle serait toujours faus- 
se, mais ce serait en fait une chaine vide definie. 

Garder le contrdle 

Comme le sait tout bon chef d'equipe, cela ne sert a rien d'etre toujours sur le dos de 
vos employes. Dites-leur simplement ce que vous voulez, et laissez-les trouver la 
meilleure maniere de le faire. De meme, la meilleure maniere de voir une expression 
reguliere, c'est comme une specification : « Voila ce que je veux ; trouve-moi une chaine 
qui correspond ». 

D'un autre cote, les meilleurs chefs d'equipe comprennent ce que leurs employes es- 
sayent de faire. C'est egalement vrai pour les expressions regulieres en Perl. Mieux vous 
comprenez comment Perl s'acquitte de la tache de trouver un motif particulier, plus 
vous serez capable d'utiliser les capacites de recherche de motif de Perl en connaissance 
de cause. 

Une des choses les plus importantes a comprendre a propos de la recherche de motif en 
Perl, c'est quand ne pas l'utiliser. 

Laisser Perl faire le boulot 

Quand certaines personnes apprennent les expressions regulieres, elles sont souvent 
tentees de voir tout probleme comme un probleme de recherche de motif. Et quand 
bien meme ce serait vrai en general, la recherche de motif est plus que la simple evalua- 
tion d'expressions regulieres. C'est aussi comme rechercher vos cles de voiture oil vous 
les avez fait tomber, et pas seulement sous le reverbere, la oil vous y voyez le mieux. 
Dans le monde reel, nous savons tous qu'il est plus efficace de chercher aux bons en- 
droits qu'aux mauvais. 

De meme, vous devriez utiliser le contrdle de flux de Perl pour decider quels motifs exe- 
cuter et lesquels ignorer. Une expression reguliere est plutot maligne, mais pas plus 
qu'un cheval. Elle peut etre distraite si elle voit trop de choses a la fois. C'est pourquoi 
il vous faut parfois lui mettre des ceilleres. Par exemple, souvenez-vous de notre prece- 
dent exemple d'alternative : 

/Gandalf | Saroumane | Radagaste/ 

Cela marche comme prevu, mais pas aussi bien que possible, car elle cherche chaque 
nom a chaque position dans la chaine avant de passer a la suivante. Les lecteurs attentifs 
du Seigneur des anneaux se souviendront que, des trois magiciens mentionnes ci-dessus, 
Gandalf est mentionne plus souvent que Saroumane, et que Saroumane est mentionne 
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plus souvent que Radagaste. II est done en general plus efficace d'utiliser les operateurs 
logiques de Perl pour realiser l'alternative : 

/Gandalf/ | | /Saroumane/ | | /Radagaste/ 

C'est egalement une autre maniere de passer outre la recherche « orientee a gauche » 
du Moteur. II ne recherche Saroumane que si Gandalf est introuvable. Et il ne cherche 
Radagaste que si Saroumane est egalement absent. 

Non seulement cela change l'ordre de recherche des differents termes, but cela permet 
egalement a l'optimiseur d'expressions regulieres de mieux fonctionner. II est en gene- 
ral plus simple d'optimiser la recherche pour une seule chame que pour plusieurs a la 
fois. De meme, les recherches ancrees peuvent souvent etre optimisees si elles ne sont 
pas trop compliquees. 

Vous n'avez pas a vous limiter a l'operateur | | pour le controle de flux. Vous pouvez 
souvent controler les choses au niveau des instructions. Vous devriez toujours penser a 
vous debarrasser des cas les plus courants en premier. Supposons que vous ecriviez une 
boucle pour traiter un fichier de configuration. La plupart des fichiers de configuration 
sont composes principalement de commentaires. C'est souvent mieux de supprimer les 
commentaires et les lignes blanches avant de s'attaquer aux lourds traitements, meme 
si les lourds traitements supprimeraient egalement les commentaires et lignes blanches 
en cours de route : 

while (<C0NF>) { 
next if / A #/; 
next if / A \s*(#|$)/; 
chomp; 

meugneumeugneu($_); 

} 

Meme si vous n'essayez pas d'etre efficace, vous avez souvent besoin d'alterner entre les 
expressions Perl normales et les expressions regulieres, simplement parce que vous vou- 
lez faire quelque chose qui n'est pas possible (ou qui est tres difficile) a l'interieur d'une 
expression reguliere, comme afficher quelque chose. Voici un classificateur de nombres 



bien utile : 








warn 


"contient des non-chiffres" 


if 


AD/; 




warn 


"pas un nombre naturel" 


unless 


/ A \d+$/; 


# rejette -3 


warn 


"pas un entier" 


unless 


/ A -?\d+$/; 


# rejette +3 


warn 


"pas un entier" 


unless 


/ A [+-]?\d+$/; 




warn 


"pas un nombre decimal" 


unless 


/ A -?\d+\.?\d*$/; 


# rejette .2 


warn 


"pas un nombre decimal" 


unless 


/ A -?(?:\d+(?:\.\d*)? 


|\.\d+)$/; 


warn 


"pas un flottant de C" 










unless / A ([+-]?)(?=\d|\.\d)\d*(\. 


Ad*)?([Ee]([+-]?\d+))?$/; 



Nous pourrions encore beaucoup allonger cette section, mais ceci est vraiment le sujet 
de tout le livre. Vous verrez encore beaucoup d'exemples melant du code Perl et des re- 
cherches de motif au long du livre. En particulier, reportez-vous a la section suivante 
Motifs programmatiques. (Mais vous pouvez quand meme commencer par lire ce qui suit, 
bien sur.) 
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Interpolation de variables 



L'utilisation des mecanismes de controle de flux de Perl pour controler les expressions 
regulieres a ses limites. La difficulte principale est qu'il s'agit d'une approche « tout ou 
rien » ; soit vous faites tourner le motif, soit vous ne le faites pas tourner. Parfois vous 
savez vaguement ce que vous cherchez, mais vous aimeriez avoir la possibilite de le pa- 
rameter. L'interpolation de variables fournit cette capacite, tout comme le parametrage 
des sous-programmes vous permet d'avoir une plus grande influence sur leur compor- 
tement que simplement de choisir entre les appeler ou non. (Vous en verrez plus sur les 
sous-programmes au chapitre suivant.) 

Un des interets de l'interpolation est de fournir un peu d'abstraction, ainsi qu'un peu 
de lisibilite. Avec des expressions regulieres, il est certes possible d'ecrire les choses de 
facon concise : 

if ($num =~ / A [-+]?\d+\.?\d*$/) { ... } 

Mais ce que vous voulez dire est plus comprehensible ainsi : 

$signe = '[-+]?'; 
$chiffres = '\d+'; 
$point_decimal = '\.?'; 
$encore_des_chiffres = '\d*'; 

$nombre = "$signe$chiffres$point_decimal$encore_des_chiffres"; 

if ($num =~ / A $nombre$/o) { ... } 

Nous couvrirons un peu plus cette utilisation de l'interpolation dans la section Motifs 
gene're's, plus loin dans ce chapitre. Notez juste que nous avons utilise le modificateur /o 
pour supprimer la recompilation du motif, car nous ne nous attendons pas a ce que 
$nombre change de valeur au cours du programme. 

Un autre true sympa est de renverser vos tests et de vous servir de la chame variable 
comme motif vis-a-vis d'un ensemble de chames connues : 

chomp($reponse = <STDIN>); 

if ("SEND" =~ / A \Q$reponse/i) { print "Action : send\n" 

elsif ("STOP" =~ / A \Q$reponse/i) { print "Action : stop\n" 

elsif ("ABORT" =~ / A \0$reponse/i) { print "Action : abort\n" 

elsif ("LIST" =~ / A \Q$reponse/i) { print "Action : list\n" 

elsif ("EDIT" =~ / A \Q$reponse/i) { print "Action : edit\n" 

Ceci permet a l'utilisateur de lancer Taction « send » en tapant S, SE, SEN ou SEND (dans 
n'importe quel melange de majuscules et minuscules). Pour faire « stop », il lui faudra 
au moins taper ST (ou St, sT ou st). 



Retour de Vantislash 

Quand vous pensez a l'interpolation entre apostrophes doubles, vous pensez generale- 
ment a l'interpolation des variables et des antislashs. Mais comme nous l'avons indique 
precedemment, il y a deux passes pour les expressions regulieres, et la passe d'interpo- 
lation laisse la plupart du travail d'interpretation des antislashs a l'analyseur d'expres- 
sions regulieres (dont nous parlerons plus tard). D'ordinaire, vous ne remarquerez pas 
de difference, car Perl fait bien attention a les masquer. (Une sequence qui est evidem- 
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ment differente est le metasymbole \b, qui se transforme en assertion de limite — en 
dehors des classes de caracteres, en tout cas. A Finterieur d'une classe de caracteres, ou 
les assertions n'ont aucun sens, il redevient un espace arriere, comme d'habitude.) 

II est en fait assez important que l'analyseur de regex gere les antislashs. Imaginons que 
vous cherchiez les caracteres de tabulation avec un motif sous le modificateur /x : 

($coll, $col2) = /(.*?) \t+ (.*?)/x; 

Si Perl ne laissait pas l'interpolation de \t a l'analyseur de regex, le \t se serait transfor- 
me en un blanc que l'analyseur de regex aurait betement ignore a cause du /x. Mais Perl 
n'est ni si ignoble, ni si piegeant. 

Vous pouvez cependant vous pieger tout seul. Imaginons que vous ayez un peu virtua- 
lise le separateur de colonne, comme ceci : 

$sepcol = "\t+"; # (apostrophes doubles) 

($coll, $col2) = /(.*?) $sepcol (.*?)/x; 

Et maintenant vous voila fait comme un rat, car le \t se transforme en veritable tabula- 
tion avant d'atteindre l'analyseur de regex, qui croira que vous avez ecrit / (.*?)+(.*?)/ 
une fois les blancs supprimes. Oups. Pour corriger cela, evitez /x ou bien utilisez des 
apostrophes simples. Ou mieux, utilisez qr//. (Voir la section suivante.) 

Les seules sequences d'echappement entre apostrophes doubles qui sont traitees comme 
telles sont les six sequences de traduction : \U, \u, \L, \1, \0 et \E. Si jamais vous vous 
plongez un jour dans le fonctionnement interne du compilateur d'expressions regulie- 
res, vous y trouverez du code destine a gerer les sequences d'echappement comme \t 
pour la tabulation, \n pour le saut de ligne, et ainsi de suite. Mais vous n'y trouverez pas 
de code pour ces six sequences de traduction. (Nous avons listees dans le tableau 5-7 uni- 
quement car c'est la qu'on s'attend a les trouver.) Si vous vous debrouillez pour les in- 
clure dans le motif sans passer par revaluation entre apostrophes doubles, elles ne 
seront pas reconnues. 

Comment ont-elles pu s'y glisser ? Vous pouvez contrecarrer l'interpolation en utilisant 
des apostrophes simples comme delimiteurs de motifs. Les apostrophes simples suppri- 
ment l'interpolation de variables et le traitement des sequences de traduction dans 
m' qr' et s' comme ils le feraient dans une chaine entre apostrophes 
simples. Ecrire m' \uf rodon ' ne trouvera pas une version en majuscules de ce pauvre fro- 
don. Cependant, comme les antislash « normaux » ne sont pas vraiment traites a ce ni- 
veau, m'YtXd' trouvera toujours une vraie tabulation suivie d'un chiffre quelconque. 

Une autre maniere de contrecarrer l'interpolation est de passer par l'interpolation elle- 
meme. Si vous ecrivez : 

$var = 

/${var}frodon/; 

ce pauvre frodon reste en minuscules. Perl ne refera pas la passe d'interpolation pour 
vous simplement parce que vous avez interpole quelque chose qui a Fair de vouloir etre 
interpole. Vous ne pouvez pas plus esperer que cela soit interpole que vous ne pourriez 
attendre que cette double interpolation marche : 

$hobbit = 'Frodon'; 

$var = ^hobbit'; # (apostrophes simples) 

/$var/; # signifie m J $hobbit J j et pas m' Frodon'. 
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Void un autre exemple qui montre comment les antislashs sont interpreted par l'analy- 
seur de regex et pas par l'interpolation de variables. Imaginons que vous ayez un petit 
utilitaire simple a lagrep : n 

#!/usr/bin/perl 
$motif = shift; 
while (<>) { 

print if /$motif/o; 

} 

Si vous appelez ce programme pgrep et l'invoquez comme suit : 
% pgrep '\t\d J *.c 

alors vous decouvrirez qu'il affiche toutes les lignes de tous vos fichiers source C dans 
lesquelles un chiffre suit une tabulation. Vous n'avez rien eu a faire de special pour que 
Perl se rende compte que \t etait une tabulation. Si les motifs de Perl etaient simple- 
ment interpoles en contexte d'apostrophes doubles, vous auriez du faire quelque chose ; 
heureusement ils ne le sont pas. lis sont directement reconnus par l'analyseur de regex. 

Le vrai programme grep a une option -i qui rend la recherche insensible a la casse. Vous 
n'avez pas besoin d'ajouter une telle option a votre programme pgrep ; il peut deja le 
faire sans modification. II suffit de lui passer un motif un peu plus elabore, avec un mo- 
dificateur /i inclus : 

% pgrep '(?i)anneau' LotR*.pod 

On cherche maintenant « Anneau », « anneau », « ANNEAU » et ainsi de suite. Vous 
ne verrez pas beaucoup cette fonctionnalite dans les motifs litteraux, puisque vous pou- 
vez simplement ecrire /anneau/i. Mais pour les motifs passes sur la ligne de commande, 
dans les formulaires web ou inclus dans les fichiers de configuration, cela peut s'averer 
primordial. 

L'operateur qr// de citation de regex 

Les variables qui sont interpolees en motifs le sont necessairement a l'execution et non 
a la compilation. Ceci ralentit l'execution, car Perl doit verifier que vous n'avez pas chan- 
ge le contenu de la variable ; si c'est le cas, il faut alors recompiler l'expression reguliere. 
Comme mentionne dans Operateurs de recherche de motifs, si vous promettez de ne ja- 
mais modifier le motif, vous pouvez utiliser l'option /o pour interpoler et compiler une 
seule fois : 

print if /$pattern/o; 

Bien que cela fonctionne correctement dans notre programme pgrep, ce n'est pas le cas 
en general. Imaginez que vous ayez une floppee de motifs et que vous vouliez tous les 
tester dans une boucle, peut-etre comme ceci : 

foreach $elem (gdonnees) { 

foreach $motif (@motifs) { 



11. Si vous ne saviez pas ce qu'est un programme comme grep, vous le saurez. II ne devrait pas y 
avoir de systeme sans grep — nous pensons que grep est le plus utile des petits programmes 
jamais inventes. (Ce qui logiquement indique que nous ne croyons pas que Perl soit un petit pro- 
gramme.) 
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if ($elem =~ /$motif /) { . . . } 

} 

} 

Vous ne pourriez pas ecrire /$motif/o, car la signification de $motif change a chaque 
tour de la boucle interne. 

Ce probleme est resolu par l'operateur qr /MOTIF/ imosx. Cet operateur cite — et compi- 
le — son MOTIF comme une expression reguliere. MOTIF est interpole de la meme facon 
que dans m/MOTIF/. Si ' est utilise comme delimiteur, aucune interpolation de variable 
(ni des sequences de traduction) n'est faite. L'operateur renvoie une valeur Perl qui peut 
etre utilisee a la place de la chaine litterale equivalente dans la recherche ou la substitu- 
tion correspondante. Par exemple : 

$regex = qr/ma .CHAINE/is; 
s/$regex/quelque chose d'autre/; 

est equivalent a : 

s/ma.CHAINE/quelque chose d'autre/is; 

Pour resoudre notre probleme precedent de boucles emboitees, vous pouvez done 
d'abord traiter le motif dans une boucle separee : 

(Sregexes = (); 
foreach $motif (@motifs) { 
push @regexes, qr/$motif/; 

} 

Ou bien d'un seul coup en utilisant l'operateur map de Perl : 

(Sregexes = map { qr/$_/ } @motifs; 

Puis modifier la boucle pour utiliser ces regex precompilers : 

foreach $elem (gdonnees) { 
foreach $re (@regexes) { 

if ($elem =~ /$re/) { ... } 

} 

} 

Desormais quand vous faites tourner la recherche, Perl n'est plus oblige de creer une ex- 
pression reguliere compilee a chaque test if, car il se rend compte qu'il en possede deja 
une. 

Le resultat d'un qr// peut meme etre interpole dans un motif plus grand, comme s'il 
s'agissait d'une simple chaine : 

$regex = qr/$motif/; 

$chaine =~ /toto${regex}titi/; # interpolation dans un motif plus grand 

Cette fois Perl recompile le motif, mais vous pourriez chainer plusieurs operateurs qr// 
en un seul. 

La raison pour laquelle cela fonctionne est que l'operateur qr// retourne un objet spe- 
cial pour lequel la conversion en chaine est surchargee comme decrit au chapitre 13, 
Surcharge. Si vous affichez la valeur de retour, vous verrez la chame equivalente : 

$re = qr/ma. CHAINE/is; 

print $re; # affiche (?si-xm:ma. CHAINE) 
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Les modificateurs /i et /s ont ete actives dans le motif car ils ont ete foumis a qr//. De 
meme, /x et /m sont desactives car ils n'ont pas ete fournis. 

A chaque fois que vous interpolez des chames de provenance inconnue dans un motif, 
vous devriez etre pret a traiter les exceptions renvoyees par le compilateur de regex, dans 
le cas oil Ton vous aurait passe une chaine contenant des bestioles indomptables : 

$re = qr/$motif/is; # peut s'echapper et vous mordre 

$re = eval { qr/$motif /is } | | warn ... # pris dans une cage exterieure 

Pour en savoir plus sur l'operateur eval, voir le chapitre 29. 

Le compilateur de regex 

Apres que la passe d'interpolation de variable est passee sur la chame, l'analyseur de re- 
gex a enfin une occasion d'essayer de comprendre votre expression reguliere. A ce ni- 
veau-la, il n'y a plus grand chose qui peut mal se passer, sinon embrouiller les 
parentheses ou utiliser une sequence de metacaracteres qui n'a aucun sens. L'analyseur 
fait une analyse recursive descendante de votre expression reguliere et si elle est correc- 
te, la met sous une forme interpretable par le Moteur (voir la section suivante). La plu- 
part des choses interessantes qui se passent dans l'analyseur sont liees a l'optimisation 
de votre expression reguliere afin qu'elle soit executee le plus rapidement possible. 
Nous ne chercherons pas a expliquer cette partie-la. C'est un secret de fabrication. (Ne 
croyez pas les rumeurs qui disent que regarder le code lie aux expressions regulieres 
vous rendra fou ; elles sont tres exagerees. Esperons-le.) 

Mais vous pourriez avoir envie de savoir ce que l'analyseur a vraiment pense de votre 
expression reguliere. Si vous lui demandez poliment, il vous le dira. En utilisant use re 
"debug";, vous pouvez examiner le traitement de votre motif par l'analyseur. (Vous 
pouvez egalement obtenir la meme information en utilisant l'option de ligne de com- 
mande -Dr. Celle-ci est disponible si votre Perl a ete compile avec l'option -DDEBUCCING 
a l'intallation.) 

#!/usr/bin/perl 
use re "debug"; 

"Smeagol" =~ / A Sm(.*)g[aeiou]l$/; 

La sortie suit. Vous pouvez voir qu'avant l'execution Perl compile la regex et donne une 
signification aux composantes du motif : BOL pour le debut de ligne ( A ou Beginning Of 
Line), REG_ANY pour le point, et ainsi de suite : 

Compiling REx ~ A Sln(.*)g[aeiou]l$ , 
size 24 first at 2 
rarest char 1 at 0 
rarest char S at 0 

l: B0L(2) 

2: EXACT <Sm>(4) 

4: 0PEN1(6) 

6: STAR(8) 

7: REG_ANY(0) 

8: CLOSEl(lO) 
10: EXACT <g>(l2) 
12: ANY0F[aeiou](2l) 
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21: EXACT <1>(23) 
23: E0L(24) 
24: END(O) 

anchored ~Sm' at 0 floating at 4. .2147483647 (checking anchored) 
anchored(BOL) minlen 5 

Certaines de ces lignes resument les conclusions de l'optimiseur de regex. II sait que la 
chaine doit commencer par « Sm » et qu'il n'y a done aucune raison de faire l'habituelle 
recherche de gauche a droite. II sait que la chaine doit se terminer par un « 1 » et peut 
done rejeter directement celles qui ne le sont pas. II sait que la chaine doit faire au moins 
cinq caracteres de long, et peut done ignorer toute chaine plus courte que cela sans autre 
forme de proces. II sait egalement quels sont les caracteres les moins courants dans cha- 
que sous-chame constante, ce qui peut aider avec les chames « etudiees » par study. 
(Voir study au chapitre 29.) 

Ensuite il liste la facon dont le motif est execute : 

Guessing start of match, REx ~ A Sm(.*)g[aeiou]l$' against ~ Smeagol-" . . . 
Guessed: match at offset 0 

Matching REx ~ A Sm(.*)g[aeiou]l$' against ~Smeagol' 
Setting an EVAL scope, savestack=3 
0 <> <Smeagol> j 1: BOL 

0 <> <Smeagol> | 2: EXACT <Sm> 

2 <Sm> <eagol> | 4: 0PEN1 

2 <Sm> <eagol> | 6: STAR 

REGANY can match 5 times out of 32767... 
Setting an EVAL scope, savestack=3 



7 <Smeagol> <> 


1 8 


: CL0SE1 


7 <Smeagol> <> 


| 10 


: EXACT <g> 




failed. . . 


6 <Smeago> <1> 


1 8: 


CL0SE1 


6 <Smeago> <1> 


| 10: 


EXACT <g> 




failed... 


5 <Smeag> <ol> 


1 8 


: CL0SE1 


5 <Smeag> <ol> 


| 10 


: EXACT <g> 




failed... 


4 <Smea> <gol> 


1 8: 


CL0SE1 


4 <Smea> <gol> 


| 10: 


EXACT <g> 


5 <Smeag> <ol> 


1 12 


: ANYOF[aeiou] 


6 <Smeago> <1> 


| 21: 


EXACT <1> 


7 <Smeagol> <> 


1 23 


: EOL 


7 <Smeagol> <> 


1 24 


: END 


Match successful! 







Freeing REx: ~ A Sm(.*)g[aeiou]l$'' 

Si vous suivez le blanc au milieu de Smeagol, vous pouvez voir le Moteur aller au plus 
loin pour que le . * soit aussi gourmand que possible, puis revient en arriere jusqu'a 
trouver une facon pour le reste du motif de reussir. Mais e'est justement le sujet de la 
section suivante. 
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« Le petit Moteur qui/(ne ) ?pouvait( pas) ?/ » 

Et maintenant nous aimerions vous raconter l'histoire du petit Moteur de Regex qui dit 
« Je crois que j'peux. Je crois que j'peux. Je crois que j'peux. ». 12 

Dans cette section, nous allons presenter les regies que le Moteur utilise pour effectuer 
les recherches de correspondance de motifs. Le Moteur est extremement perseverant et 
travailleur. II est tout a fait capable de continuer a travailler alors que vous croyiez qu'il 
aurait deja abandonne. Le Moteur n'abandonne pas tant qu'il n'est pas absolument sur 
qu'il n'y a aucun moyen pour lui de trouver une correspondance entre le motif et la 
chaine. Les regies ci-dessous expliquent comment le Moteur « croit qu'il peut » aussi 
longtemps que possible, jusqu'a ce qu'il sache qu'il peut ou ne peut pas. Le probleme de 
notre Moteur est qu'il ne s'agit pas simplement de faire monter un train en haut d'une 
colline. II s'agit de parcourir un espace (potentiellement) tres complique de possibilites, 
en se souvenant de la ou il est passe ou pas. 

Le Moteur utilise un automate fini non deterministe (NFA, nondeterministic finite-state 
automaton) pour trouver une correspondance. Cela signifie simplement qu'il garde une 
trace de ce qu'il a et n'a pas essaye, et quand cela ne donne aucun resultat, il revient en 
arriere et essaye autre chose. C'est le retour arriere, ou backtracking. Le Moteur Perl est 
capable d'explorer un million de possibilites pour une partie de la recherche, pour les 
abandonner et aller a la partie de recherche suivante, puis recommencer a explorer 
pour celle-ci le meme million de possibilites. Le Moteur n'est pas tres intelligent ; il est 
juste perseverant et exhaustif II est cependant possible d'ecrire des motifs efficaces qui 
n'occasionnent pas trop de retours arrieres inutiles. 

Quand on vous dit « Les regex choisissent la correspondance la plus a gauche la plus 
longue », cela signifie que Perl prefere la plus a gauche a la plus longue. Mais le Moteur 
ne sait pas qu'il privilegie quelque chose a ce niveau. Le choix global resulte de nom- 
breux choix particuliers et independants. Voici ces choix : 13 

Regie 1 

Le Moteur essaye de trouver une correspondance aussi loin que possible a gauche de 
la chaine, afin que la totalite de l'expression reguliere corresponde selon la regie 2. 
Le Moteur demarre juste avant le premier caractere et essaye de faire correspondre 
la totalite de l'expression reguliere depuis ce point. L'expression reguliere corres- 
pond si et seulement si le moteur atteint la fin de l'expression sans s'etre arrete a la 
fin de la chame. S'il a trouve, il s'arrete immediatement — il ne recherche pas s'il 
existe une « meilleure » solution, meme si le motif peut correspondre a la recher- 
che de plusieurs autres manieres. 

S'il n'arrive pas a trouver une correspondance au motif a la premiere position de la 



12. NdT : « The little Engine that could » est l'histoire d'une petite locomotive qui tire un gros 
chargement de toutes ses forces sans abandonner. Elle est connue de beaucoup d'enfants ameri- 
cains, mais n'a rien de remarquable si ce n'est le « I think I can. I think I can. I think I can... » qui 
ressemble legerement au bruit d'un moteur a vapeur (en anglais). 

13. Certains de ces choix peuvent etre ignores si Poptimiseur a son mot a dire, ce qui revient a 
faire des coupes dans un arbre de decision. Dans le cadre de cette discussion, nous faisons comme 
si l'optimiseur n'existait pas. 
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chaine, il reconnait temporairement sa defaite et va a la position suivante de la 
chaine, entre le premier et le deuxieme caracteres, puis reessaie a nouveau toutes 
les possibilites. En cas de succes, il s'arrete. Sinon, il continue plus avant dans la 
chaine. La recherche de correspondance dans son ensemble ne sera consideree 
comme un echec qu'apres avoir essaye de faire correspondre toute Fexpression 
reguliere a toutes les positions de la chaine, y compris apres le dernier caractere. 
Une chaine de n caracteres fournit done en fait n + 1 positions oil correspondre. C'est 
parce que les debut et fin de correspondance se trouvent entre les caracteres de la 
chaine. Cette regie surprend parfois les gens quand il ecrivent un motif tel que /x*/ 
qui recherche zero ou plus « x ». Si vous essayez ce motif sur une chaine comme 
« dix », il ne trouvera pas le « x ». II trouvera en fait la chaine nulle juste avant le 
« d » et n'ira jamais chercher plus loin. Si vous voulez trouver un ou plusieurs x, vous 
devriez plutot utiliser le motif /x+/. Voir les quantificateurs a la regie 5. 
Un corollaire a cette regie est que toute expression reguliere qui peut trouver la 
chaine nulle est assuree de correspondre a la position la plus a gauche de la chaine 
(en l'absence de toute assertion de largeur vide qui verifie le contraire). 

Regie 2 

Quand le Moteur rencontre une alternative (aux elements separes par des | ), que 
ce soit au niveau global ou au niveau du regroupement courant, il les essaie succes- 
sivement de gauche a droite, en s'arretant a la premiere correspondance qui assure 
le succes du motif dans son ensemble. 

Une alternative correspond a une chaine si un element quelconque de Falternative 
correspond au sens de la regie 3. Si aucun des elements de l'alternative ne corres- 
pond, il retourne a la regie qui a invoque cette regie, qui est en generale la regie 1, 
mais pourrait tres bien etre la regie 4 ou 6 dans un regroupement. Cette regie cher- 
chera alors une nouvelle position oil appliquer la regie 2. 

S'il n'existe qu'un seul terme d'alternative, alors celui-ci est verifie ou non, et la 
regie 2 est toujours valable. (II n'existe pas de zero alternative, car une chaine vide 
correspond toujours a quelque chose de longueur nulle.) 

Regie 3 

Un terme donne d'une alternative est verifie si chacun de ses elements est lui aussi 
verifie selon les regies 4 et 5 (de facon a ce que toute fexpression reguliere soit satis- 
faite). 

Un element peut consister en une assertion, qui est regie par la regie 4, ou en un 
atome quantified qui est regi par la regie 5. Les elements a choix multiples sont hie- 
rarchises de la gauche vers la droite. Si les elements ne peuvent etre verifies, le 
Moteur rebrousse chemin jusqu'au choix suivant selon la regie 2. 
Les elements qui doivent etre verifies sequentiellement ne sont pas separes dans 
Fexpression reguliere par quoi que ce soit de syntaxique ; ils sont simplement juxta- 
poses dans l'ordre dans lequel ils doivent etre verifies. Lorsque vous cherchez 
/ A toto/, vous demandez en fait la detection de cinq elements les uns a la suite des 
autres. Le premier est une assertion de longueur nulle et les quatre autres des lettres 
ordinaires qui se correspondent a elles-memes, Fune apres Fautre, selon la regie 5. 
L'ordre hierarchique de gauche a droite implique que dans un motif tel que : 
/x*y*/ 
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x* choisit une maniere de correspondre, puis y* essaie toutes ses possibilities. Si cela 
echoue, x* choisit alors sa deuxieme possibility et fait reessayer toutes ses possibili- 
tes a y*. Et ainsi de suite. Les elements a droite « varient plus vite », pour emprun- 
ter une expression au vocabulaire des tableaux multidimensionnels. 

Regie 4 

Si une assertion ne correspond pas a la position courante, le Moteur revient en 
arriere a la regie 3 et reessaie les elements plus haut dans la hierarchie avec des 
choix differents. 

Certaines assertions sont plus fantaisistes que d'autres. Perl connait beaucoup 
d'extensions de regex, dont certaines sont des assertions de largeur nulle. Par exem- 
ple, l'assertion positive de prevision (?=...) et l'assertion negative de prevision 
(?!...) ne correspondent en realite a aucun caractere, mais s'assurent plutot que 
l'expression reguliere representee par . . . correspondrait (ou non), si nous l'avions 

'14 

essayee. 
Regie 5 

Un atome quantifie n'est verifie que si et seulement si l'atome lui-meme est verifie 
un nombre de fois autorise par le quantificateur. (L'atome est verifie selon la regie 6). 
Des quantificateurs differents impliquent un nombre different de verifications, et 
la plupart d'entre eux permettent un nombre variable de verifications. Les corres- 
pondances multiples doivent etre faites a la suite, c'est-a-dire qu'elles sont adjacen- 
tes dans la chaine. Un atome non quantifie est suppose avoir un quantificateur ne 
demandant qu'une seule verification (c'est-a-dire que /x/ est identique a /x{l}/). Si 
aucune correspondance n'est trouvee a la position courante pour aucune des quan- 
tites autorisees pour l'atome en question, le Moteur revient a la regie 3 et reessaye 
des elements d'ordre hierarchique plus eleve avec des valeurs differentes. 
Les quantificateurs sont *,+,?,*?,+?,?? et les differentes formes d'accolades. Si 
vous utilisez la forme {COMPTE}, alors il n'y a pas le choix et l'atome doit correspon- 
dre le nombre exact de fois precise, ou pas du tout. Sinon, l'atome peut etre recher- 
che parmi un ensemble de possibilites de repetition, et le Moteur garde une trace 
de tous les choix pour revenir en arriere si besoin est. Mais la question est alors de 
savoir quel choix faire en premier. On pourrait commencer par le nombre maximal 
et le reduire au fur et a mesure, ou demarrer avec le nombre minimal et l'augmen- 
ter petit a petit. 

Les quantificateurs traditionnels (sans point d'interrogation a la suite) specifient 
une recherche gourmande ; c'est-a-dire qu'ils essaient de verifier autant de caracteres 
que possible. Pour trouver la correspondance maximale, le Moteur doit faire un 
petit peu attention. Les mauvais choix coutent potentiellement cher, c'est pourquoi 
le Moteur ne compte pas vraiment a partir de la valeur maximale, qui pourrait 
apres tout etre Tres Grande et provoquer des millions de mauvais choix. Le Moteur 
fait en realite quelque chose d'un petit peu plus malin : il commence par compter 



14. En realite, elle est testee par le Moteur. Celui-ci retourne a la regie 2 pour tester le sous-motif, 
puis efface toute trace de ce qui avait ete consomme de la chaine, pour ne retourner que le succes 
ou l'echec du sous-motif comme valeur de l'assertion. (II se souvient cependant de toute chaine 
capturee.) 
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de facon croissante combien d'atomes correspondants (a la suite) sont effectivement 
presents dans la chaine, puis utilise ce maximum reel comme premier essai. (II se 
souvient aussi des choix les plus courts, au cas ou le plus long ne marcherait pas.) II 
essaie (enfin) de verifier le reste du motif, en supposant que le choix le plus long est 
le bon. Si le choix le plus long ne produit de correspondance pour le reste du motif, 
il revient en arriere et essaie le plus long suivant. 

Si vous ecrivez / .*toto/ par exemple, il essayera de trouver le nombre maximum 
de caracteres « quelconques » (representes par le point) jusqu'a la fin de la ligne 
avant meme de commencer a chercher « toto » ; puis quand le « toto » ne corres- 
pond pas a cet endroit (et il ne peut pas, puisqu'il n'y a pas assez de place en fin de 
chame pour le trouver), le Moteur va reculer d'un caractere a la fois jusqu'a trouver 
un « toto ». S'il y a plus d'un « toto » sur la ligne, il s'arretera au dernier, puisque 
ce sera en fait le premier qu'il rencontre au cours de sa remontee. Quand le motif 
complet reussit en utilisant une longueur particuliere de .*, le Moteur sait qu'il 
peut abandonner les autres choix plus courts pour . * (ceux qu'il aurait utilises si le 
« toto » en cours n'avait finalement pas fonctionne). 

En mettant un point d'interrogration apres n'importe quel quantificateur gour- 
mand, vous le transformez en quantificateur frugal qui choisit la plus petite quan- 
tite pour son premier essai. Done, si vous ecrivez / . *?toto/, le . *? essayera d'abord 
de correspondre a 0 caracteres, puis 1, puis 2, et ainsi de suite jusqu'a trouver le 
« toto ». Au lieu de rebrousser chemin en arriere, il rebrousse chemin en avant, 
pour ainsi dire. Et finit par trouver le premier « toto » de la ligne au lieu du der- 
nier. 

Regie 6 

Chaque atome correspond selon son type. Si l'atome n'est pas verifie (ou Test, mais 
que sa verification ne permet pas de correspondance pour le reste du motif), le 
Moteur revient en arriere a la regie 5 et essaie le choix suivant possible en quantite 
pour cet atome. 

Les atomes correspondent selon les types suivants : 

• Une expression reguliere entre parentheses, (■■■), trouve tout ce que l'expres- 
sion reguliere representee par . . . trouve selon la regie 2. Les parentheses servent 
done d'operateur de regroupement pour la quantification. Les parentheses sim- 
ples ont egalement pour effet de capturer la sous-chaine trouvee pour une utili- 
sation ulterieure comme reference arriere (ou backreference en anglais). Cet effet 
de bord peut etre supprime en utilisant plutot (?:...), qui n'a que les proprietes 
de regroupement ; il ne stocke rien dans $1, $2 et autres. II existe d'autres formes 
d'atomes (et d'assertions) entre parentheses — voir la suite de ce chapitre. 

• Un point correspond a tout caractere, sauf eventuellement le saut de ligne. 

• Une liste de caracteres entre crochets (une classe de caracteres) correspond a 
n'importe lequel des caracteres specifies dans la liste. 

• Une lettre precedee d'un antislash correspond soit a un caractere particulier, soit 
a un caractere d'un ensemble particulier, comme indique dans le tableau 5-7. 

• Tout autre caractere precede d'un antislash correspond a ce caractere lui-meme. 

• Tout caractere non mentionne ci-dessus se correspond a lui-meme. 
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Tout cela peut sembler plutot complique, mais l'avantage est que pour chaque liste de 
choix donnee par un quantificateur ou une alternative, le Moteur a un bouton a tour- 
ner. II tournera tous ces boutons jusqu'a ce que tout le motif corresponde. Les regies ne 
font qu'indiquer dans quel ordre le Moteur peut tourner ces boutons. Dire que le Mo- 
teur prefere la correspondance la plus longue a gauche signifie simplement que le bou- 
ton qu'il tourne le plus lentement est celui correspondant a la position de depart. 
Revenir en arriere consiste simplement a tourner dans Fautre sens le bouton tourne a 
l'instant de facon a essayer un autre bouton plus haut dans l'ordre hierarchique, c'est-a- 
dire un qui varie plus lentement. 

Voici un exemple plus concret sous la forme d'un programme qui detecte quand deux 
mots consecutif partagent un suffixe et un prefixe communs : 

$a = 'conflit'; 
$b = 'litige'; 

if ("$a $b" =~ / A (\w+)(\w+) \2(\w+)$/) { 
print "$2 superpose dans $l-$2-$3\n"; 

} 

Ceci affiche : 

lit superpose dans conf-lit-ige 

Vous pourriez croire que $1 capture d'abord Fintegralite de « chienlit » par gourman- 
dise. C'est exactement ce qu'il fait — d'abord. Mais une fois rendu la, il n'y a plus de ca- 
racteres a mettre dans $2, qui a besoin de recevoir des caracteres a cause du 
quantificateur +. Le Moteur bat done en retraite et $1 donne a contrecoeur un caractere 
a $2. Cette fois Fespace est trouve correctement, mais quand il voit le \2, qui represente 
un simple « t ». Le caractere suivant dans la chaine n'est pas un « t », mais un « 1 ». 
Ceci fait done revenir le Moteur en arriere et reessayer plusieurs fois, pour finalement 
forcer $1 a laisser le lit a $2. 

En fait, cela ne marchera pas forcement bien si la superposition elle-mime est un dou- 
blon, comme pour les mots « rococo » et « cocon ». L'algorithme ci-dessus aurait sim- 
plement decide que la chaine en superposition, $2, devait etre « co » plutot que 
« coco ». Mais nous ne voulons pas de « rocococon » ; nous voulons plutot un 
« rococon ». Nous voici dans un cas oil il est possible d'etre plus malin que le Moteur. 
L'ajout d'un quantificateur minimal a la partie correspondant a $1 donne le motif bien 
meilleur / A (\w+?) (\w+) \2(\w+)$/, qui fait exactement ce que nous voulons. 

Pour une discussion plus detaillee des avantages et inconvenients des differentes sortes 
de moteurs d'expressions rationnelles, reportez-vous au livre de Jeffrey Friedl, Maitrise 
des expressions regulieres (ou en version originale Mastering Regular Expressions). Le Mo- 
teur d'expressions regulieres de Perl fonctionne tres bien pour tous les problemes quo- 
tidiens que vous voulez resoudre avec Perl, mais tout aussi correctement pour ce genre 
de probleme pas si quotidien, pourvu que vous soyez un peu comprehensif. 
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Motifs etendus 
Assertions peripheriques 

Parfois vous voulez juste jeter un ceil. Voici quatre extensions de regex qui vous aident 
justement a faire cela. Nous les appelons peripheriques (en anglais lookaround) car elles 
vous permettent de jeter un oeil alentour de facon hypothetique, sans correspondre ef- 
fectivement a des caracteres. Ces assertions testent le fait qu'un motif correspondrait (ou 
non) dans le cas oil nous l'essayerions. Le Moteur fait cela en essayant effectivement de 
faire correspondre le motif puis en pretendant par la suite qu'il n'y a pas eu de corres- 
pondance de faite (meme si c'est le cas). 

Quand le Moteur regarde en avant par rapport a sa position actuelle dans la chaine, 
nous parlons d'assertion At prevision 1 * 5 (lookahead). S'il regarde en arriere, nous parlons 
d'assertion de retrovision. Les motifs de prevision peuvent etre n'importe quelle expres- 
sion rationnelle, tandis que les motifs de retrovision ne peuvent qu'etre de longueur 
fixe, car ils doivent savoir d'oii partir pour leur correspondance hypothetique. 

Alors que ces quatre extensions sont toutes de largeur nulle, et ne consomment done 
pas de caracteres (du moins pas officiellement), vous pouvez en fait capturer des sous- 
chaines a l'interieur si vous fournissez un niveau supplemental de parentheses de cap- 
ture. 

( ? =MOTIF) (positive de prevision) 

Quand le Moteur rencontre (?=MOTIF), il regarde en avant dans la chaine pour 
s'assurer que MOTIF se produit. Pour memoire, dans notre precedent suppresseur de 
doublons, nous avons du ecrire une boucle car notre motif consommait trop de 
texte a chaque tour : 

$_ = "Paris AU AU AU AU printemps." 

# supprime les doublons (et les triplons (et les quadruplons. . .)) 

1 while s/\b(\w+) \l\b/$l/gi; 
A chaque fois que vous entendez « consomme trop », vous devriez immediatement 
penser « assertion de pre-vision ». (Enfin, presque toujours.) En regardant a 
Favance au lieu de directement avaler le deuxieme mot, vous pouvez ecrire un sup- 
presseur de doublons qui fonctionne en une passe, comme ceci : 

s/ \b(\w+) \s (?= \l\b ) //gxi; 
Evidemment, il y a encore un probleme, puisque cela va malmener des phrases par- 
faitement valides comme « J'ai une BELLE BELLE-mere ». 

( ? ! MOTIF) ( negative de prevision) 

Quand le Moteur rencontre (?! MOTIF), il regarde en avant dans la chaine pour 
s'assurer que MOTIF n'apparait pas. Pour corriger notre exemple precedent, nous 
pouvons ajouter une assertion negative de prevision apres l'assertion positive pour 



15. NdT : Ce terme et le suivant ne sont pas forcement tres heureux, c'est pourquoi nous vous 
fournissons le vocabulaire original pour que vous soyez pas etonnes en lisant des documenta- 
tions utilisant ces termes. 
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eliminer le cas des mots composes : 

s/ \b(\w+) \s (?= \l\b (?! -\w))//xgi; 
Ce \w final est necessaire pour eviter de confondre un mot compose avec mot suivi 
d'un tiret. Nous pouvons meme aller plus loin, puisque plus tot dans ce chapitre 
nous nous sommes intentionnellement servis de l'expression « nous nous 
sommes », et que nous aimerions que notre programme ne « corrige » pas cela 
pour nous. Nous pouvons done ajouter une alternative a l'assertion negative de 
pre-vision de maniere a ne pas corriger cela (et montrer ainsi que n'importe quel 
type de parentheses peut servir a regrouper des alternatives) : 

s/ \b(\w+) \s (?= \l\b (?! -\w | \s sommes) )//gix; 
Nous nous sommes maintenant assures que cette formulation specifique n'aura pas 
de probleme. Helas le poeme Mes petites amoureuses de Rimbaud est toujours 
casse 16 . Aussi ajoutons-nous une nouvelle exception : 

s/ \b(\w+) \s (?= \l\b (?! -\w | \s sommmes | \s aimions))//igx; 
Voila qui commence a s'emballer. Faisons plutot une Liste Officielle d'Exceptions, 
en utilisant un mignon petit true d'interpolation avec la variable $" pour separer 
les elements de l'alternative avec le caractere | : 

gnousnous = qw(sommes aimions); 

local $"='|'j 

s/ \b(\w+) \s (?= \l\b (?! -\w | \s (?: @nousnous )))//xig; 

(?<=PATTERN) (positive de re'trovision) 

When the Engine encounters (?<=PATTERN), it looks backward in the string to 
ensure that PATTERN already occurred. 

Notre exemple a toujours un probleme. Bien que l'on permette a Rimbaud de dire 
« Nous nous aimions », cela autorise egalement « La totalite des des sommes 
seront converties en Euros ». Nous pouvons ajouter une assertion positive de retro- 
vision en tete de notre liste d'exceptions pour nous assurer que nous n'appliquons 
nos exceptions @nousnous qu'a un vrai « nous nous ». 

s/ \b(\w+) \s (?= \l\b (?! -\w | (?<= nous) \s (?: (Snousnous )))//ixg; 
Oui, tout cela devient bien complique, mais rappelons que cette section s'appelle 
Motifs etendus. Si vous avez besoin de compliquer encore le motif apres ce que nous 
lui avons fait subir, l'utilisation judicieuse des commentaires et de qr// devrait vous 
aider a ne pas devenir fou. 

( ?< \MOTIF) (negative de retrovision) 

Quand le Moteur rencontre (?< ! MOTIF), il regarde en arriere dans la chame pour 
s'assurer que MOTIF n'a pas ete trouve. 

Essayons avec un exemple simple cette fois-ci. Pourquoi pas une regie d'orthogra- 
phe facile ? Si vous ne savez plus si un mot se termine en « euil » ou en « ueil », et 



16. NdT : Tres exactement a la troisieme strophe : 

Nous nous aimions a cette epoque, 
Bleu laideron ! 

On mangeait des ceufs a la coque 
Et du mouron ! 
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que vous avez plutot la manie d'ecrire « ueil » (parce que vous etes ne a Rueil, par 
exemple). L'expression reguliere suivante peut remettre les choses en ordre : 

s/(?< !c |g)ueil/euil/g 
Ne pas savoir ecrire « fauteuil » ou « cerfeuil » n'est pas un ecueil et ne doit pas 
blesser votre orgueil. 

Sous-motifs sans retour arriere 

Comme nous l'avons decrit dans « Le petit Moteur qui/(ne )?pouvait( pas)?/ », le Moteur 
fait souvent machine arriere alors qu'il progresse le long d'un motif. Vous pouvez em- 
pecher le Moteur de faire demi-tour au milieu d'une serie de possibilites en creant un 
sous-motif sans retour arriere. Un sous-motif sans retour arriere se presente comme 
(?>MOTIF), et fonctionne exactement comme un simple ( ? :MOTIF), sauf qu'une fois que 
MOTIF a trouve une correspondance, il supprime toute possibility de retour arriere sur 
tous les quantificateurs ou alternatives a l'interieur du sous-motif. (C'est pourquoi il est 
inutile d'utiliser cela sur un MOTIF qui ne contient pas de quantificateurs ou d'alternati- 
ves.) La seule maniere de le faire changer d'avis est de rebrousser chemin jusqu'a quel- 
que chose avant ce sous-motif et de reentrer dans le sous-motif par la gauche. 

C'est comme rendre visite a un concessionaire automobile. Apres un certain temps de 
discussion sur le prix, vous finissez par donner un ultimatum : « Voici ma meilleure 
offre : c'est a prendre ou a laisser. ». S'ils ne la prennent pas, vous ne recommencez pas 
a marchander. Vous operez un retour arriere vers la porte. Vous pouvez ensuite aller 
voir un autre concessionaire et recommencer a marchander. Vous pouvez recommencer 
a marchander, mais seulement parce que vous etes reentre dans le sous-motif sans re- 
tour arriere dans un contexte different. 

Pour les adorateurs de Prolog ou SNOBOL, vous pouvez voir cela comme un operateur 
cut ou fence a portee limitee. 

Voyons comment dans "aaab" =~ /(?:a*)ab/, le a* commence par trouver trois a, puis 
en laisse un car le dernier a est utilise plus loin. Le sous-motif sacrifie une partie de son 
butin pour permettre a toute la correspondance de reussir. (Ce qui revient a laisser le 
marchand de voitures obtenir un peu plus de votre argent par peur de ne pas pouvoir 
conclure l'affaire.) En revanche, le sous-motif dans "aaab" = ~ /(?>a*)ab/ n'abandon- 
nera rien de ce qu'il a pu trouver, meme si cette attitude fait echouer la correspondance 
toute entiere. 

Bien que ( ? >MOTIF) soit utile pour modifier le comportement d'un motif, il est souvent 
utilise pour accelerer l'echec de certaines recherches dont vous savez qu'elles vont 
echouer (a moins qu'elles ne reussissent tout a fait). Le Moteur peut prendre un temps 
extraordinairement long pour echouer, en particulier avec des quantificateurs emboi- 
tes. Le motif suivant reussira de facon quasi-instantanee : 

$_ = "aaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaab"; 
/a*a*a*a*a*a*a*a*a*a*a*a*a*a*a*a*a*a*a*a*a*a*a*a*a*a*a*a*a*a*a*a*[b]/; 

Mais ce n'est pas le succes qui est un probleme. C'est l'echec qui en est un. Si vous retirez 
ce « b » final de la chaine, le motif va probablement tourner pendant des annees et des 
annees avant d'echouer. Pendant des millenaires et des millenaires. En realite des mil- 
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liards et des milliards d'annees. Vous pouvez constater en examinant le motif qu'il ne 
peut reussir s'il n'y a pas de « b » a la fin de la chame ; mais l'optimiseur n'est pas assez 
malin (au moment oil nous ecrivons ces lignes) pour se rendre compte que /[b]/ est 
equivalent a /b/. Mais si vous lui donnez un indice, vous pouvez le faire echouer rapi- 
dement tout en le laissant reussir la ou il peut : 

/(?>a*a*a*a*a*a*a*a*a*a*a*a*a*a*a*a*a*a*a*a*a*a*a*a*a*a*a*a*a*a*a*a*) [b]/; 

Voici un exemple plus realiste (esperons). Imaginez un programme qui est suppose lire 
paragraphe par paragraphe et n'afficher que les lignes qui se continuent, les lignes de 
continuation etant specifiees par un antislash final. Voici un exemple tire du Makefile 
de Perl qui utilise cette convention : 

# Files to be built with variable substitution before miniperl 

# is available. 

sh = Makefile. SH cflags.SH configh.SH makeaperl.SH makedepend.SH \ 
makedir.SH myconfig.SH writemain.SH 

Vous pourriez ecrire votre programme de cette facon : 

#!/usr/bin/perl -OOp 

while ( /( (.+) ( (?<=\\) \n .* )+ ) /gx) { 
print "D'ai $.: $l\n\n"; 

} 

Ca marche, mais c'est vraiment tres lent. C'est parce que le Moteur fait machine arriere 
un caractere a la fois depuis la fin de la ligne, en diminuant ce qui se trouve dans $1. 
C'est sans interet. L'ecrire sans les captures surnumeraires n'ameliore pas sensiblement 
les choses. Utiliser : 

(.+(?:(?<=\\)\n.*)+) 

pour un motif est un peu plus rapide, mais pas tellement. C'est dans ce cas qu'un motif 
sans retour arriere est tres utile. Le motif : 

((?>.+)(?:(?<=\\)\n.*)+) 

fait la meme chose, mais est plus rapide d'un ordre de grandeur. C'est parce qu'il ne perd 
pas son temps a chercher quelque chose qui n'est pas la. 

II n'est pas possible d'obtenir avec (?>...) un succes que vous n'auriez obtenu avec 
(?:...) ou meme un simple (...)• Ma is si votre recherche doit echouer, autant 
echouer rapidement et passer a la suite. 

Motifs programmatiques 

La plupart des programmes Perl sont ecrits dans un style imperatif (aussi appele proce- 
dural). C'est un peu comme une suite d'ordres listes dans un facile a suivre : 
« Prechauffer le four, melanger, glacer, cuire, laisser refroidir, servir aux martiens. ». 
Parfois vous rajoutez a ce melange une bonne cuilleree de programmation fonctionnel- 
le (« Utilisez un peu plus de glacage que vous ne pensez en avoir besoin, meme apres 



17. En fait, c'est plutot de l'ordre des septillions d'annees. Nous ne savons pas exactement com- 
bien de temps cela prendrait. Nous n'avons pas eu la patience d'attendre de le voir echouer. En 
tous les cas, votre ordinateur risque fort de planter avant que Funivers ne disparaisse, et cette 
expression reguliere met plus de temps que ces deux evenements a se produire. 
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avoir tenu compte de ce conseil, recursivement ») ou vous le saupoudrez de quelques 
techniques orientees-objet (« Merci de laisser les objets anchois de cote »). Souvent c'est 
un melange de tout cela a la fois. 

Mais le Moteur d'expressions regulieres a une approche completement differente de la 
resolution de problemes, une approche plus declarative. Vous decrivez vos objectifs 
dans le langage des expressions regulieres, et le Moteur implemente la logique necessai- 
re pour atteindre vos objectifs. Les langages de programmation logique (comme Prolog) 
ont une moins grande visibilite que les trois autres styles, mais ils sont plus repandus 
que vous ne pourriez le croire. Perl ne pourrait meme pas etre construit sans make ou 
yacc ; tous deux pouvant etre considered, sinon comme des langages purement declara- 
tifs, au moins comme des hybrides qui melangent la programmation imperative et la 
programmation logique. 

Vous pouvez aussi faire ce genre de choses en Perl, en melangeant ensemble des decla- 
rations d'objectifs avec du code imperatif, de facon encore plus fluide que nous ne 
l'avons fait jusqu'a present afin de profiter des forces de chacun. Vous pouvez construire 
programmatiquement la chaine que vous allez finir par proposer au Moteur de regex, 
c'est-a-dire d'une certaine maniere creer un programme qui ecrit un nouveau program- 
me a la volee. 

Vous pouvez egalement fournir des expressions Perl normales comme remplacement 
dans si 1 1 a l'aide du modificateur /e. Ceci vous permet de generer dynamiquement la 
chaine de remplacement en executant un morceau de code a chaque fois que le motif 
correspond. 

D'une maniere encore plus elaboree, vous pouvez inclure des bouts de code partout ou 
vous le voulez au beau milieu d'un motif en utilisant Fextension (?{CODE}). Celui-ci 
sera execute a chaque fois que le Moteur rencontrera ce code, au fur et a mesure de ses 
peregrinations, dans la danse compliquee des retours en arriere. 

Enfin, vous pouvez utiliser s///ee ou (??{C0Df}) pour ajouter un nouveau niveau 
d'indirection : le resultat de l'execution de ces bouts de code sera lui-meme reevalue 
pour etre reutilise, creant des morceaux de programme et de motif au vol, juste a temps. 

Motifs generis 

II a ete dit 18 que les programmes qui ecrivent des programmes sont les programmes les 
plus heureux au monde. Dans le livre de Jeffrey Friedl, Maitrise des expressions re'gulieres 
(Mastering Regular Expressions), le tour de force final montre comment ecrire un program- 
me qui produit une expression reguliere capable de determiner si une chaine est confor- 
me au standard defini par le RFC 822 ; c'est-a-dire s'il contient un en-tete de mail 
conforme au standard. Le motif produit fait plusieurs milliers de caracteres de long, et est 
aussi facile a lire qu'un dump memoire binaire apres un crash. Mais le detecteur de motif 
de Perl s'en moque ; il compile juste le motif sans difficulte et, ce qui est encore plus inte- 
ressant, l'execute tres rapidement — bien plus rapidement, en fait, que beaucoup de mo- 
tifs beaucoup plus courts qui ont des besoins de retour arriere plus compliques. 

C'est un exemple tres complique. Nous vous avons precedemment montre un exemple 
tres simple de la meme technique quand nous avons fabrique un motif $nombre a partir 



18. Par Andrew Hume, le celebre philosophe Unix. 
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de ses elements constitutifs (voir la section Interpolation de variables). Mais pour vous 
montrer la puissance de l'approche programmatique pour la production d'un motif, 
nous allons nous pencher sur un probleme de complexite moyenne. 

Supposons que vous vouliez trouver tous les exemples de mots avec une certaine suite 
de voyelles et de consonnes ; par exemple « audio » et « aeree » suivent tous deux un 
motif VVCVY Meme si decrire ce qui compte comme voyelle ou consonne est simple 19 , 
vous n'aurez pas vraiment envie de l'ecrire plus d'une fois. Meme pour un cas simple 
comme notre WCVY vous devrez ecrire un motif comme : 

A [aeiouy] [aeiouy] [bcdfghjklmnpqrstvwxzy] [aeiouy] [aeiouy]$ 

Un programme plus general accepterait une chaihe comme « VVCVV » pour generer 
(programmatiquement) le motif pour vous. Pour etre meme encore plus flexible, il 
pourrait meme accepter un mot comme « audio », l'utiliser comme modele pour en 
deduire « VVCVV » et de la construire le long motif ci-dessus. Cela a l'air complique, mais 
ne l'est vraiment pas, car nous allons laisser le programme generer le motif pour nous. 
Voici un simple programme cvmap qui fait tout cela : 

#!/usr/bin/perl 

$voyelles = ' aeiouy' ; 

$consonnes = ' bcdfghjklmnpqrstvwxzy'; 

%assoc = (C => $consonnes, 

V => $voyelles); # initialise la liste pour V et C 

for $classe ($voyelles, $consonnes) { # pour chaque type 

for (split II, $class) { # recupere chaque lettre de chaque type 
$assoc{$_} .= $class; # et reassocie chaque lettre a chaque type 

} 

} 



for $char (split //, shift) { 

$motif .= "[$assoc{$char}]"; 
appropriee 
} 

$re = qr/ A ${motif}$/i; 
print "REGEX : $re\n"; 
@ARGV = (Vusr/dict/words') 
if -t && !@ARGV; 

while (<>) { 

print if /$re/; 



# pour chaque lettre du modele 

# ajoute la classe de caracteres 



# compile le motif 

# affiche une verification 

# prend un dictionnaire par defaut 



# et maintenant parcourt l'entree 

# en affichant les lignes qui 

# correspondent 



19. NdT : Plus simple en anglais qu'en francais, car nos classes de caracteres seraient plutot 
[aaaeeeeeeiiioouuu ,y] pour les voyelles et [bccdefghjklmnpqrstvwxyz] pour les consonnes. Et 
nous ne vous parlons meme pas des ligatures ! Dans les exemples qui suivent, le dictionnaire uti- 
lise est une version sans accents. L'adaptation pour traiter les accents est laissee en exercice au lec- 
teur. Notez cependant que use locale; vous facilitera les \w. 
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La variable %assoc contient tous les morceaux interessants. Elle utilise chaque lettre de 
l'alphabet comme cle, et la valeur correspondante est l'ensemble des lettres du meme 
type. Nous ajoutons egalement V et C, pour que vous puissiez utiliser « VVCVV » ou 
« audio » et tout de meme obtenir « aeree ». Chaque caractere de l'argument fourni 
est utilise pour trouver la classe de caracteres associee et l'ajouter au motif Une fois le 
motif cree et compile par qr//, la correspondance (meme si le motif est tres long) va 
tourner rapidement. Voici un extrait de ce que vous pourriez obtenir en faisant tourner 
ce programme « fortuitement » : 

% cvmap fortuitement /usr/dict/wordsfr 

REGEX : (?i-xsm: A [cbdfghjklmnpqrstvwxzy] [aeiouy] [cbdfghjklmnpqrstvwxzy] [cbd 

fghjklmnpqrstvwxzy] [aeiouy] [aeiouy] [cbdfghjklmnpqrstvwxzy] [aeiouy] [cbdfghjk 

lmnpqrstvwxzy] [aeiouy] [cbdfghjklmnpqrstvwxzy] [cbdfghjklmnpqrstvwxzy]$) 

banqueterent 

becqueterent 

bestialement 

biscuiterent 

cabriolerent 

cabriolerons 

cabrioleront 

certainement 

circuiterent 

En vous laissant admirer cette REGEX, nous vous persuaderons verbeusement mais certaine- 
ment de l'economie de frappe ainsi sommairement realisee. 

Evaluations de substitution 

Quand le modificateur /e (« e » pour evaluation d'expression) est utilise sur une expres- 
sion s/MOTIF/CODE/e, la partie de remplacement est interpretee comme une expression, 
et pas seulement comme une chaine entre apostrophes doubles. C'est comme un do 
{CODE}. Meme si cela a Pair d'une chaine, c'est simplement un bloc de code qui sera 
compile en meme temps que le reste de votre programme, bien avant que la substitu- 
tion ne soit reellement faite. 

Vous pouvez utiliser le modificateur /e pour construire des chames de remplacement 
avec une logique plus fantaisiste que celle que permet Finterpolation entre doubles 
apostrophes. Voici la difference : 

s/(\d+)/$l * 2/; # Remplace "42" par "42 * 2" 
s/(\d+)/$l * 2/e; # Remplace "42" par "84" 

Et ceci convertit les degres Celsius en Fahrenheit : 

$_ = "Prechauffez le four a 233C.\n"; 

s/\b(\d+\.?\d*)C\b/int($l * 1.8 + 32) . "F'Ve; # convertit en 451F 

Les applications sont sans limite. Voici un filtre qui modifie un fichier en place (comme 
un editeur) en ajoutant 100 a tout nombre qui se trouve en debut de ligne (et qui n'est 
pas suivi par des deux-points, que nous ne faisons que regarder, sans les trouver ni les 
remplacer) : 

% perl -pi -e , s/ A (\d+)(?=:)/100 + $l/e' fichier 
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De temps a autre, vous voudrez faire un peu plus que simplement utiliser dans un autre 
calcul la chaine que vous avez trouvee. Vous voulez parfois que cette chame soit un cal- 
cul, dont vous utiliserez revaluation en tant que valeur de remplacement. Chaque mo- 
dificateur /e supplemental rajoute un eval autour du code a executer. Les deux lignes 
suivantes font la meme chose, mais la premiere est plus facile a lire : 

s /MOTIF/ CODE /ee 
s/MOTIF/eval(CODE)/e 

Vous pourriez utiliser cette technique pour remplacer les apparitions de valeurs scalai- 
res simples par leurs valeurs : 

s/(\$\w+)/$l/eeg; # Interpole les valeurs de la plupart des scalaires 

Comme c'est vraiment un eval, le /ee trouve meme les variables lexicales. Un exemple 
un peu plus elabore calcule la valeur de remplacement pour des expressions arithmeti- 
ques simples sur des entiers (positifs) : 

$_ = "D'ai 4+19 euros et 8/2 centimes. \n"; 



Comme tout autre eval CHAINE, les erreurs de compilation (comme des problemes de 
syntaxe) et les exceptions a l'execution (comme une division par zero) sont capturees. 
Dans ce cas, la variable $@ ($EVAL_ERROR) dit ce qui s'est mal passe. 

Evaluation de code lors de la recherche 

Dans la plupart des programmes qui utilisent les expressions regulieres, ce sont les struc- 
tures de controle du programme tout autour qui dirigent le flux logique de l'execution. 
Vous ecrivez des boucles if ou while, faites des appels de fonctions ou de methodes, qui 
se trouvent appeler une operation de recherche de motif de temps a autre. Meme avec 
s///e, c'est l'operateur de substitution qui a le controle et n'execute le code de rempla- 
cement qu'apres une recherche reussie. 

Avec les sous-motifs de code, la relation usuelle entre les expressions regulieres et le code 
du programme est inversee. Alors que le Moteur applique ses regies a votre motif au 
moment de la recherche, il peut tomber sur une extension de regex de la forme 
( ?{C0DE }). Quand il est declenche, ce sous-motif ne fait aucune reconnaissance ni aucu- 
ne assertion peripherique. C'est une assertion de largeur nulle qui « reussit » toujours 
et n'est evaluee que pour ses effets de bord. A chaque fois que le moteur doit passer sur 
le sous-motif de code pour progresser dans le motif, il execute ce code. 

"glyphe" =~ /.+ (?{ print "yo" }) ./x; # Affiche "yo" deux fois. 

Alors que le Moteur essaie d'etablir la correspondance entre « glyphe » et ce motif, il 
laisse d'abord . + avaler les cinq lettres. Puis il affiche « yo ». Quand il tombe sur le point 
final, les cinq lettres ont deja ete avalees ; il lui faut done faire machine arriere sur le . + 
et lui faire rendre une des lettres. II avance de nouveau dans le motif, faisant un nouvel 
affichage de « yo » au passage, fait correspondre e au point final et termine sa recherche 
avec succes. 



s{ 



\d+ \s* 

[+*/-] 
\s* \d+ 



# trouve un entier 

# et un operateur arithmetique 

# et un autre entier 



) 

}{ $1 
print 



}eegx; 



# puis trouve $1 et execute ce code 

# "D'ai 23 euros et 4 centimes." 
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Les accolades autour du fragment de CODE sont destinees a vous rappeler qu'il s'agit d'un 
bloc de code Perl, et qu'il se comporte comme un bloc au sens lexical. C'est-a-dire que 
si vous utilisez my pour declarer une variable a portee lexicale, elle sera privee a ce bloc. 
Mais si vous utilisez local pour localiser une variable a portee dynamique, il risque de 
ne pas faire ce a quoi vous vous attendez. Un sous-motif ( ?{COD£}) cree une portee dy- 
namique implicite qui reste valide pour le reste du motif, jusqu'a ce qu'il reussisse ou 
qu'il fasse machine arriere a travers ce sous-motif de code. Une maniere de voir cela est 
que le bloc ne retourne pas vraiment quand il arrive a la fin. Au lieu de cela, il faut un 
appel recursif invisible au Moteur pour essayer de detecter le reste du motif. C'est seu- 
lement quand cet appel recursif se termine qu'il revient du bloc, en « delocalisant » les 
variables localisees. 20 

Dans l'exemple suivant, nous initialisons $i a 0 en incluant un sous-motif de code au 
debut du motif. Ensuite nous capturons autant de caracteres que possible avec . * — 
mais nous mettons un autre sous-motif de code entre le . et 1'* comme cela nous pour- 
rons savoir combien de fois le . trouve quelque chose. 

$_ = 'lothlorien'; 

m/ (?{ $i = 0 }) # Met $i a 0 

(. (?{ $i++ }) )* # Met a jour $i, meme apres un retour 

# en arriere 

lori # Force un retour arriere 

/x; 

Le Moteur se met done joyeusement en route, mettant $i a 0 et laissant . * gober les 10 
caracteres de la chaine. Quand il recontre le lori dans le motif, il revient en arriere et 
abandonne quatre caracteres du . *. A la fin de la recherche, $i vaudra toujours 10. 

Si vous vouliez que $i represente le nombre de caracteres que le . * a effectivement con- 
serves a la fin, vous pouvez utiliser la portee dynamique a l'interieur du motif : 

$_ = 'lothlorien'; 
m/ (?{ $i = 0 }) 

(. (?{ local $i = $i + 1; }) )* # Met a jour $i, avec protection contre 
le retour arriere 
lori 

(?{ $resultat = $i }) # Copie dans une variable non localisee 

/x; 

Ici nous utilisons local pour nous assurer que $i contient le nombre de caracteres trou- 
ves par .*, en tenant compte des retours en arriere. $i sera perdue apres la fin de l'ex- 
pression reguliere, aussi le sous-motif de code (?{ $result = $i }) conserve la valeur 
de $i dans $resultat. 



20. Les personnes familieres des analyseurs recursif descendants pourront trouver ce comporte- 
ment perturbant parce que de tels compilateurs retournent d'un appel de fonction recursif des 
qu'ils arrivent a trouver quelque chose. Le Moteur ne fait pas cela — quand il trouve quelque 
chose, il descend plus profond en recursion (meme quand il sort d'un groupe entre parentheses !). 
Un analyseur recursif descendant est a un minimum de recursion quand il reussit a la fin, mais le 
Moteur est a un maximum de recursion quand il reussit a la fin du motif. Vous pourriez trouver 
utile de faire pendre le motif par son extremite gauche et de le voir comme une representation 
de l'arbre des appels. Si vous arrivez a visualiser cette image, la portee dynamique des variables 
locales vous sera plus comprehensible. (Et si vous ne pouvez pas, ce n'est pas pire qu'avant.) 
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La variable speciale $ A R (decrite au chapitre 28) contient le resultat du dernier 
(?{CODE}) qui a ete execute au cours d'une recherche reussie. 

Vous pouvez utiliser une extension (?{CODE}) comme la COND d'une (?(COND)SIV- 
RAI | SI FAUX) . Si vous faites cela, $ A R ne sera pas mis a jour et vous pouvez omettre les 
parentheses autour de la condition : 

"glyphe" =~ /.+(?(?{ $toto{titi} gt "symbole" }). |signet)./; 

Ici, nous testons si $toto{titi} est plus grand que symbole. Si oui, nous incluons . dans 
le motif, sinon nous incluons signet dans le motif. On peut Tether pour le rendre un 
peu plus lisible : 

"glyphe" =~ m{ 

.+ # quelques n'importe quoi 

(?(?{ # si 

$toto{titi} gt "symbole" # ceci est vrai 

}) 

# trouve un autre n'importe quoi 

# sinon 

signet # trouve signet 

) 

# et un n'importe quoi de plus 

}x; 

Quand use re 'eval' est enclenche, une regex a le droit de contenir un sous-motif 
(?{CODE}) meme si l'expression reguliere interpole des variables : 

/(.*?) (?{length($l) < 3 && warn}) $suffixe/; # Erreur sans use re 'eval' 

Ceci est normalement interdit pour des raisons de securite. Meme si le motif ci-dessus 
est sans danger car $suf f ixe est sans danger, l'analyseur de regex ne peut pas savoir quel- 
les parties de la regex ont ete interpolees et lesquelles ne l'ont pas ete. C'est pourquoi il 
interdit simplement les sous-motifs de code s'il y a eu de Finterpolation. 

Si le motif s'obtient a partir de donnees entachees, meme use re 'eval' n'autorisera 
pas la recherche de motif a continuer. 

Quand use re 'taint' est enclenche et qu'une chaihe entachee est la cible d'une regex, 
les sous-motifs captures (dans les variables numerotees ou dans la liste de valeurs ren- 
voyees par m// en contexte de liste) sont entaches. Cela est utile quand les operations de 
regex sur des donnees entachees sont destinees non pas a extraire des sous-chaines sures, 
mais plutot pour faire de nouvelles transformations. Voir le chapitre 23, Securite, pour 
en savoir plus sur l'entachement. Pour ce pragma, les expressions regulieres precompi- 
lees (obtenues en general par qr//) ne sont pas considerees comme interpolees : 

/toto${motif}titi/ 

Ceci est autorise si $motif est une expression reguliere precompilee, meme si $motif 
contient des sous-motifs (?{CODE}). 

Precedemment nous vous avons montre un peu de ce que use re 'debug' affiche. Une 
solution de deboguage un peu plus primitive consiste a utiliser des sous-motifs 
(?{CODE}) pour afficher ce qui a ete trouve jusqu'ici dans la recherche : 

"abcdef" =~ / .+ (?{print "Trouve jusqu'a present : $&\n"}) bcdef $/x; 

Ceci affiche : 
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Trouve jusqu'a present : abcdef 

Trouve jusqu'a present : abcde 

Trouve jusqu'a present : abed 

Trouve jusqu'a present : abc 

Trouve jusqu'a present : ab 

Trouve jusqu'a present : a 

ce qui montre . + gobant toutes les lettres et les rendant une par une au fur et a mesure 
que le Moteur rebrousse chemin. 

Interpolation de motif lors de la recherche 

Vous pouvez construire des morceaux de votre motif depuis l'interieur du motif lui-me- 
me. L'extension (??{COD£}) vous permet d'inserer du code qui s'evalue en un motif va- 
lide. C'est comme ecrire /$motif /, sauf que vous pouvez generer $motif a l'execution — 
plus specifiquement, lors de la recherche. Par exemple : 

Aw (??{ if ($seuil > l) { "rouge" } else { "bleu" } }) \d/x; 

C'est equivalent a AwrougeW si $seuil est plus grand que 1 et a AwbleuW sinon. 

Vous pouvez inclure des references arrieres a l'interieur du code evalue pour deduire de 
motifs de chames trouvees a l'instant (meme si elles ne seront plus trouvees plus tard 
pour cause de retour arriere). Par exemple, ceci trouve toutes les chames qui se lisent de 
la meme facon a l'envers et a l'endroit (plus connues sous le nom de palindromadaires, 
ce sont des phrases avec une bosse au milieu) : 

/ A (.+) .? (??{quotemeta reverse $l}) $/xi; 

Vous pouvez equilibrer des parentheses comme suit : 

$texte =~ /( \(+ ) (.*?) (??{ '\)' x length $1 })/x; 

Ceci trouve les chaines de la forme (shazam! ) et (((shazam! ))), et met shazam! dans 
$2. Helas, il est incapable de savoir si les parentheses au milieu sont equilibrees. Pour 
cela nous avons besoin de recursion. 

Heureusement, vous pouvez aussi faire des motifs recursifs. Vous pouvez avoir un motif 
compile utilisant ( ? ? { CODE } ) et faisant reference a lui-meme. La recherche recursive est 
plus irreguliere, pour des expressions regulieres. Tous les textes sur les expressions regu- 
lieres vous diront qu'une expression rationnelle standard ne peut pas trouver des paren- 
theses equilibrees correctement. Et c'est correct. II est aussi vrai que que les regex de Perl 
ne sont pas standard. Le motif suivant 21 trouve un ensemble de parentheses equilibrees, 
quelle que soit leur profondeur : 



$pe = qr{ 



(?: 



(?> [ A ()]+ ) 



# Non parentheses sans retour arriere 



(??{ $pe }) 



# Groupe avec des parentheses equilibrees 



)* 



21. Remarquez que vous ne pouvez pas declarer la variable dans Finstruction oil vous allez l'uti- 
liser. Vous pouvez toujours la declarer avant, bien sur. 
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\) 

}x; 

Vous pourriez l'utiliser comme ceci pour trouver un appel de fonction : 
$foncmotif = qr/\w+$pe/; 

'mafonc(l,(2*(3+4)),5)' =~ / A $foncmotif$/; # Trouve ! 

Interpolation conditionnelle 

L'extension de regex (?(COND)SIVRAI\ SIFAUX) ressemble a l'operateur ?: de Perl. Si 
COND est vrai, le motif SIVRAI est utilise ; sinon le motif SIFAUX est utilise. COND peut etre 
une reference arriere (exprime comme un entier simple, sans le \ ou le $), une assertion 
peripherique ou un sous-motif de code (voir Assertions peripheriques et Evaluation de code 
lors de la recherche plus haut dans ce chapitre). 

Si COND est un entier, il est traite comme une reference arriere. Par exemple : 

#!/usr/bin/perl 

$x = 'Perl est gratuit.'; 

$y = 'PatronGiciel coute 99EUR. ' ; 

foreach ($x, $y) { 

/ A (\w+) (?:est| (coute)) (?(2)(\d+EUR) |\w+)/; # Soit (\d+EUR), soit \w+ 
if ($3) { 

print "$1 coute de l'argent. \n"; # PatronGiciel coute 

# de l'argent. 

} else { 

print "$1 ne coute rien.\n"; # Perl ne coute rien. 

} 

} 

Ici, COND est (2), qui est vrai s'il existe une deuxieme reference arriere. Si c'est le cas, 
(\d+EUR) est ajoute au motif (et cree la reference arriere $3) ; sinon, \w+ est utilise. 

Si COND est un assertion peripherique ou un sous-motif de code, la veracite de Fassertion 
est utilisee pour determiner s'il faut inclure SIVRAI ou SIFAUX : 

/[ATGC]+(?(?<=AA)G|C)$/; 

Ceci utilise une assertion de retrovision comme COND pour trouver une sequence d'ADN 
qui se termine soir par AAG ou une autre combinaison de bases et un C. 

Definir vos propres assertions 

Vous ne pouvez pas modifier le fonctionnement du Moteur de Perl, mais si vous etes 
suffisament cingle, vous pouvez changer la facon dont il voit votre motif Comme Perl 
interprete votre motif de maniere analogue a une chame entre apostrophes doubles, 
vous pouvez utiliser les merveilles de la surcharge des constantes chaine pour vous ar- 
ranger pour que les suites de caracteres de votre choix soient automatiquement trans- 
formees en d'autres suites de caracteres. 

Dans l'exemple qui suit, nous definissons deux transformations qui doivent se produire 
quand Perl rencontre un motif. D'abord nous definissons \tag de facon a ce que lors- 
qu'il apparait dans un motif, il est automatiquement transforme en (?:<.*?>) , qui trou- 
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ve la plupart des balises HTML et XML. Ensuite, nous « redefinissons » le metasymbole 
\w de facon a ce qu'il n'accepte que les lettres anglaises. 

Nous allons definir un paquetage nomme Tagger qui cache la surcharge a notre pro- 
gramme principal. Une fois que cela est fait, nous pourrons ecrire : 

use Tagger; 

$_ = '<I>chalneau</I> , ; 

print "Balise chameau trouvee" if Atag\w+\tag/; 

Voici Tagger. pm, soit la forme d'un module Perl (voir chapitre 11) : 

package Tagger; 
use overload; 

sub import { overload: : constant 'qr' => \&convert } 

sub convert { 

my $re = shift; 
$re =~ s/ Wtag /<.*?>/xg; 
$re =~ s/ \\w /[A-Za-z]/xg; 
return $re; 

} 

i; 

Le module Tagger recoit le motif immediatement avant l'interpolation, aussi pouvez 
vous sauter la surcharge en sautant l'interpolation, comme suit : 

$re = J \tag\w+\tag'; # Cette chaine commence avec \t, une tabulation 
print if /$re/; # Trouve une tabulation, suivie d'un "a"... 

Si vous vouliez personnaliser la variable interpolee, appelez la fonction convert direc- 
tement : 

$re = J \tag\w+\tag'; # Cette chaine commence avec \t, une tabulation 

$re = Tagger :: convert $re; # convertit \tag et \w 

print if /$re/; # $re devient <.*?>[A-Za-z]+<.*?> 

Et maintenant, si vous vous demandez toujours ce que sont ces fameuses sub dans le 
module Tagger, vous allez le decouvrir bien vite, car c'est le sujet du chapitre suivant. 



6 

Sous-programmes 



Comme beaucoup de langages, Perl foumit des sous-programmes definis par l'utilisa- 
teur. 1 Ces sous-programmes peuvent etre definis n'importe oil dans le programme prin- 
cipal, charges depuis d'autres fichiers grace aux mots-cles do, require ou use ou generes 
a l'execution avec eval. Vous pouvez meme les charger a l'execution avec le mecanisme 
decrit dans la section Autochargement du chapitre 10, Paquetages. Vous pouvez appeler 
un sous-programme indirectement, en utilisant une variable contenant son nom ou 
une reference a la routine ou a travers un objet, en laissant l'objet determiner quel sous- 
programme doit vraiment etre appele. Vous pouvez generer des sous-programmes ano- 
nymes, accessibles seulement a travers des references, et si vous voulez, vous en servir 
pour doner de nouvelles fonctions quasiment identiques a l'aide defermetures, qui sont 
decrites dans la section du meme nom du chapitre 8, References. 



Syntaxe 

Pour declarer un sous-programme nomme sans le definir, utilisez l'une de ces formes : 

sub NOM 

sub NOM PROTO 

sub NOM ATTRS 

sub NOM PROTO ATTRS 

Pour declarer et definir un sous-programme, ajoutez un BLOC : 

sub NOM BLOC 
sub NOM PROTO BLOC 
sub NOM ATTRS BLOC 

sub NOM PROTO ATTRS BLOC 



1. Nous les appellerons aussi fonctions, mais les fonctions sont identiques aux sous-programmes 
en Perl. Parfois nous les appellerons meme methodes, qui sont definies de la meme facon, mais 
appelees differemment. 
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Pour creer un sous-programme anonyme ou une fermeture, omettez le NOM : 



sub PROTO ATTRS BLOC 

PROTO et ATTRS representent le prototype et les attributs, chacun d'entre eux etant pre- 
sente dans sa propre section plus loin dans ce chapitre. lis ne sont pas si importants ; le 
NOM et le BLOC sont les parties essentielles, y compris quand elles sont absentes. 

Pour les formes sans NOM, vous devez toujours fournir une maniere d'appeler le sous-pro- 
gramme. Assurez-vous done de sauvegarder la valeur de retour, car non seulement cette 
forme de declaration de sub est compilee comme vous pouviez vous y attendre, mais 
elle fournit egalement une valeur de retour a l'execution : 

$refsub = sub BLOCK; 
Pour importer des sous-programmes definis dans un autre module, ecrivez : 

use MODULE qn(NOMl N0M2 N0M3...); 

Pour appeler les sous-programmes directement, ecrivez : 

NOM(LISTE) # & est optionel avec des parentheses. 

NOM LISTE # Parentheses facultatives si sub predeclaree/importee. 

&NOM # Passe le @_ courant a ce sous-programme 

# (et contourne les prototypes). 

Pour appeler des sous-programmes de facon indirecte (par leur nom ou par reference), 
utilisez n'importe laquelle de ces formes : 

&$ref sub(LISTE) # Le & n'est pas facultatif pour un appel indirect 
$refsub->(/.ISr£) # (sauf en utilisant une notation infixe). 
&$refsub # Passe le @_ courant a ce sous-programme. 

Le nom officiel d'un sous-programme comprend le prefixe &. Un sous-programme peut 
etre appele en utilisant le prefixe, mais le & est en general optionnel, ainsi que les paren- 
theses si le sous-programme a ete predeclare. Cependant, le & n'est pas optionnel quand 
vous ne faites que nommer le sous-programme, comme quand il est utilise comme ar- 
gument de defined ou undef ou quand vous voulez generer une reference a un sous- 
programme nomme en ecrivant $ref sub = \&nom. Le & n'est pas non plus optionnel 
quand vous voulez faire un appel de sous-programme indirect en utilisant l'une des 
constructions &$refsub() ou &{$refsub}(). Cependant, la notation la plus commode 
$ref sub->() n'en a pas besoin. Voir le chapitre 8 pour en savoir plus au sujet des refe- 
rences de sous-programmes. 

Perl n'impose pas de modele particulier d'ecriture en majuscules ou minuscules pour 
vos noms de sous-programme. Cependant une convention vaguement suivie est que les 
fonctions appelees indirectement par Perl a l'execution (BEGIN, CHECK, INIT, END, AUTO- 
LOAD, DESTROY et toutes les fonctions mentionnees au chapitre 14, Variables lie'es) sont 
toutes en majuscules, aussi vaut-il probablement mieux eviter ce style. (Mais les sous- 
programmes utilises pour des valeurs constantes portent d'habitude un nom tout en ca- 
pitales. C'est normal. Nous esperons...) 



sub 
sub 
sub 



PROTO 



BLOC 
BLOC 
ATTRS BLOC 
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Semantique 

Avant de vous mettre dans tous vos etats a cause de toute cette syntaxe, souvenez-vous 
que la maniere normale de definir un simple sous-programme finit par ressembler a 
cela : 

sub guincher { 

print "Vous voila guinche.Xn"; 

} 

et que la maniere normale de l'appeler est simplement : 
guincher(); 

Dans ce cas, nous avons ignore l'entree (les arguments) et la sortie (les valeurs de re- 
tour). Mais les modeles Perl pour passer des donnees, a et depuis un sous-programme, 
sont vraiment assez simples : tous les parametres de la fonction sont passes comme une 
seule liste a plat de scalaires, et s'il y a plusieurs valeurs de retour, elles sont de meme 
retournees a l'appelant comme une seule liste a plat de scalaires. Comme pour toute 
LISTE, les tableaux et les hachages passes dans cette liste s'interpoleront dans la liste a 
plat, perdant par la meme leur identite. Mais il existe plusieurs manieres de contourner 
cela, et Finterpolation automatique de liste est souvent tres utile. Les listes de parame- 
tres, comme les listes de retour, peuvent contenir autant (ou aussi peu) d'elements que 
vous voulez (bien que vous puissiez imposer certaines contraintes aux listes de parame- 
tres en utilisant des prototypes). En effet, Perl est concu autour de cette notion de fonc- 
tions variadiques (qui peuvent prendre n'importe quel nombre d'arguments) ; en C, au 
contraire, elles sont plus ou moins bidouillees a contrecceur de facon a ce que vous puis- 
siez appeler printf{3). 

Maintenant, si vous voulez un langage concu pour passer un nombre variable d'argu- 
ments arbitraires, vous devriez vous arranger pour qu'il soit facile de traiter ces listes ar- 
bitraires d'arguments. Tout argument passe a un sous-programme Perl est fourni dans 
le tableau @_. Si vous appelez une fonction avec deux arguments, ils sont accessibles a 
l'interieur de la fonction comme les deux premiers elements de ce tableau : $_[0] et 
$_[ 1 ] . Comme @_ est un tableau ordinaire avec un nom extraordinaire, vous pouvez lui 
faire tout ce que vous pouvez normalement faire a un tableau. 2 Le tableau @_ est un ta- 
bleau local, mais ses valeurs sont des alias des veritables parametres scalaires. (C'est con- 
nu sous le nom de semantique de passage par reference.) Vous pouvez done modifier 
les veritables parametres si vous modifiez l'element correspondant de @_ (c'est cepen- 
dant rarement fait, tellement il est facile de renvoyer des valeurs interessantes en Perl). 

La valeur de retour du sous-programme (ou de n'importe quel bloc, en fait) est la valeur 
de la derniere expression evaluee. Vous pouvez aussi utiliser une instruction return ex- 
plicite pour specifier la valeur de retour et sortir du sous-programme depuis n'importe 
quel point a l'interieur. Dans les deux cas, si la fonction est appelee en contexte scalaire 
ou de liste, l'expression finale de cette fonction est appelee dans ce meme contexte. 



2. C'est un domaine ou Perl est plus orthogonal que la plupart des autres langages de program- 
mation. 
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Trues avec la liste de parametres 

Perl n'a pas encore de parametres formels nommes, mais en pratique tout ce que vous 
avez besoin de faire, e'est de copier les valeurs de @_ dans une liste my, qui sert parfaite- 
ment de liste de parametres formels. (Ce n'est pas une coincidence si la copie des valeurs 
change un passage par reference en passage par valeur, ce qui est le fonctionnement que 
les gens attendent habituellement, mime s'ils ne connaissent pas le vocabulaire de l'in- 
formatique theorique.) Voici un exemple typique : 

sub setenv_peut_etre { 

my ($cle, $valeur) = @_; 

$ENV{$cle} = $valeur unless $ENV{$cle}; 

} 

Mais vous n'etes pas oblige de nommer vos parametres, ce qui est tout l'interet du ta- 
bleau @_. Par exemple, pour calculer un maximum, vous pouvez juste iterer directe- 
ment sur @_ : 

sub max { 

my $max = shift (@_); 
for my $element (@_) { 

$max = $element if $max < $element; 

} 

return $max; 

} 

$meilleurjour = max($lun,$mar,$mer,$jeu,$ven); 

Ou vous pouvez remplir tout un hachage d'un coup : 

sub configuration { 
my %options = @_; 

print "Verbosite maximaleAn" if $options{VERBOSE} == 9; 

} 

configuration(PASSWORD => "xyzzy", VERBOSE => 9, SCORE => 0); 

Voici un exemple oil vos arguments formels ne sont pas nommes afin de pouvoir mo- 
difier les arguments eux-memes : 

majuscules_sur_place($vl, $v2); # ceci change $vl et $v2 
sub majuscules_sur_place { 
for (@_) { tr/a-z/A-Z/ } 

} 

Bien sur, vous n'avez pas le droit de modifier des constantes de cette facon. Si Fun des 
arguments etait en fait un scalaire comme "hobbit" ou une variable en lecture seule 
comme $1 et que vous essayiez de le modifier, Perl leverait une exception (vraisembla- 
blement fatale et menacant potentiellement votre carriere). Par exemple, ceci ne mar- 
chera pas : 

majuscules_sur_place("philippe"); 

Ce serait beaucoup plus sur si la fonction ma juscules_sur_place etait ecrite de facon a 
renvoyer des copies de ses parametres, au lieu de les modifier directement : 
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($v3, $v4) = majuscules($vl, $v2); 
sub majuscules { 

my @parms = @_; 

for (@parms) { tr/a-z/A-Z/ } 

# Verifie si nous avons ete appeles en contexte de liste. 
return wantarray ? @parms : $parms[o]; 

} 

Remarquez comme cette fonction (sans prototype) se moque de savoir si on lui a passe 
de veritables scalaires ou des tableaux. Perl aplatira tout dans une grande liste a plat de 
parametres dans @_. C'est Fun des cas oil Perl brille par son style simple de passage de 
parametres. La fonction majuscules fonctionnera parfaitement bien sans changer sa de- 
finition, mime si on lui passe des choses comme ca : 

(Snouvelleliste = majuscules ((jDlistel, @liste2); 
(Sinouvelleliste = majuscules( split 1:1 , $var ); 

Ne vous laissez cependant pas tenter par cela : 

(@a, @b) = majuscules(@listel, @liste2); # FAUX 

Pourquoi ? Parce que, tout comme la liste des parametres entrants dans @_ est plate, la 
liste de retour est aussi a plat. Ceci stocke done tout dans @a, et vide @b en y stockant la 
liste vide. Voir la section Passage de references pour d'autres manieres de s'y prendre. 

Indications d'erreur 

Si vous voulez que votre fonction se termine de facon a ce que l'appelant realise qu'une 
erreur s'est produite, la maniere la plus naturelle de faire est d'utiliser un return simple 
sans argument. De cette facon, quand la fonction est appelee en contexte scalaire, l'ap- 
pelant recoit undef et quand elle utilisee en contexte de liste, l'appelant recoit une liste 
vide. 

Dans des circonstances extraordinaires, vous pourriez choisir de lever une exception 
pour indiquer une erreur. Utilisez cependant cette mesure avec parcimonie, sinon votre 
programme va se retrouver envahi de gestionnaires d'exception. Par exemple, ne pas 
reussir a ouvrir un fichier dans une fonction generique d'ouverture de fichier n'est pas 
vraiment un evenement exceptionnel. En revanche ignorer une telle erreur en serait 
vraiment un. La fonction integree wantarray retourne undef si votre fonction a ete ap- 
pelee en contexte vide ; vous pouvez done savoir si la valeur de retour de votre fonction 
est ignoree : 

if ($quelquechose_a_plante) { 

return if defined wantarray; # bon, ce n'est pas un contexte vide 
die "Fais attention a mon erreur, espece d'inconscient !!!\n"; 

} 

Problemes de portee 

Les sous-programmes peuvent etre appeles de facon recursive, car chaque appel recoit 
son propre tableau d'arguments, meme quand la routine s'appelle elle-meme. Si un 
sous-programme est appele en utilisant la forme &, la liste d'arguments est optionnelle. 
Si la forme en & est utilisee, mais que la liste d'arguments est omise, quelque chose de 
special se produit : le tableau @_ de la routine appelante est fourni implicitement. II 
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s'agit d'un mecanisme d'efficacite que les nouveaux utilisateurs prefereront eviter. 



&toto(l,2,3); # passe trois arguments 
1010(1,2,3); # pareil 

toto(); # passe une liste vide 

&toto(); # pareil 

Stoto; # toto() recoit les arguments courants, comme toto(@_), 

# mais plus vite ! 

toto; # comme toto() si sub toto est predeclare, sinon le mot 

# simple "toto" 



Non seulement la forme & rend la liste d'arguments optionnelle, mais elle desactive ega- 
lement toute verification de prototypage sur les arguments fournis. Ceci en partie pour 
des raisons historiques et en partie pour fournir un moyen efficace de tricher si vous sa- 
vez ce que vous faites. Voir la section Prototypes plus loin dans ce chapitre. 

Les variables qui sont utilisees dans la fonction, mais qui n'ont pas ete declarees privees 
a cette fonction, ne sont pas necessairement des variables globales ; elles continuent a 
suivre les regies normales de portee de Perl. Comme explique dans la section Noms du 
chapitre 2, Composants de Perl, cela signifie qu'elles cherchent d'abord a etre resolues 
dans la ou les portees lexicales englobantes, puis ensuite dans la portee du paquetage. 
Du point de vue d'un sous-programme, toute variable my d'une portee lexicale englo- 
bante est done parfaitement visible. 

Par exemple, la fonction bumpx, ci-dessous, a acces a la variable lexicale $x (a portee sur 
tout le fichier) car la portee dans laquelle ce my a ete declare — le fichier lui-meme — 
n'a pas ete fermee avant la definition du sous-programme : 

# debut du fichier 

my $x = 10; # declare et initialise la variable 

sub bumpx { $x++ } # la fonction peut voir la variable lexicale externe 

Les programmeurs C et C++ verraient probablement $x comme une variable « statique 
de fichier ». Elle est privee en ce qui concerne les fonctions dans les autres fichiers, mais 
globale du point de vue des fonctions declarees apres le my. Les programmeurs C qui 
viennent a Perl en cherchant ce qu'ils appeleraient des « variables statiques » pour des 
fichiers ou des fonctions ne trouvent pas un tel mot-cle. Les programmeurs Perl evitent 
en general le mot « statique », parce que les systemes statiques sont morts et ennuyeux 
et que le mot est tres charge historiquement. 

Bien que Perl ne dispose pas du mot « static » dans son dictionnaire, les programmeurs 
Perl n'ont aucun probleme pour creer des variables qui restent privees a une fonction 
et persistent d'un appel de fonction a un autre. C'est juste qu'il n'existe pas de mot spe- 
cial pour decrire cela. Les primitives de portee de Perl sont plus riches et se combinent 
avec sa gestion automatique de memoire de telle maniere que quelqu'un cherchant le 
mot-cle « static » pourrait ne jamais penser a les utiliser. 

Les variables lexicales ne passent pas automatiquement au ramasse-miettes simplement 
parce que Ton est sorti de leur portee ; elles attendent de ne plus etre utilisees pour etre 
recyclees, ce qui est bien plus important. Pour creer des variables privees qui ne sont pas 
automatiquement reinitialisees entre deux appels de fonction, incluez la fonction tout 
entiere dans un bloc supplementaire et mettez a la fois la declaration my et la definition 
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de la fonction a Finterieur de ce bloc. Vous pouvez meme y mettre plus d'une fonction 
pour leur dormer un acces partage a une variable qui, sinon, est privee. 

{ 

my $compteur = 0; 

sub nextcompteur { return ++$compteur } 
sub prevcompteur { return --$compteur } 

} 

Comme toujours, Faeces a la variable lexicale est limite au code se trouvant dans la 
meme portee lexicale. Les noms des deux fonctions sont cependant globalement acces- 
sibles (a Finterieur du paquetage) et, comme les fonctions ont ete definies dans la por- 
tee de $compteur, elles peuvent tout de meme acceder a cette variable bien que 
personne d'autre ne le puisse. 

Si cette fonction est chargee par require ou use, alors c'est probablement parfait. Si tout 
se passe dans le programme principal, vous devrez vous assurer que toute affectation a 
my a l'execution est executee suffisament tot, soit en mettant tout le bloc avant votre pro- 
gramme principal, soit en placant un bloc BEGIN ou INIT autour pour etre sur qu'il sera 
execute avant que votre programme ne demarre : 

BEGIN { 

my @gamme = qw/ do re mi fa sol la si /; 
my $note = -1; 

sub ton_suivant { return $gamme[ ($note += l) %= @gamme ] }; 

} 

Le BEGIN n'affecte ni la definition du sous-programme, ni la persistence des lexicales uti- 
lisees par le sous-programme. II est juste la pour s'assurer que les variables sont initiali- 
sees avant que la routine soit appelee. Pour plus d'information sur la declaration de 
variables privees et globales, voir respectivement my et our au chapitre 29, Fonctions. Les 
constructions BEGIN et INIT sont expliquees au chapitre 18, Compilation. 

Passage de references 

Si vous voulez passer plus d'un tableau ou d'un hachage, depuis ou vers une fonction, 
tout en maintenant leur integrite, vous aurez alors besoin d'un mecanisme explicite de 
passage de references. Avant cela, vous aurez besoin de comprendre les references ainsi 
qu'elles sont expliquees au chapitre 8. Faute de quoi, cette section risque de ne pas etre 
tres comprehensible. Enfin, vous pourrez toujours regarder les images... 

Voici quelques exemples simples. Definissons d'abord une fonction qui attend une refe- 
rence a un tableau. Quand le tableau est grand, il est beaucoup plus rapide de le passer 
comme une simple reference plutot que comme une longue liste de valeurs : 

$total = somme ( \@a ); 

sub somme { 

my ($reftab) = @_; 
my ($total) = 0; 

foreach (@$reftab) { $total += $_ } 
return $total; 

} 
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Passons plusieurs tableaux a une fonction, et faisons-la depiler (via pop) chacun d'entre 
eux, en renvoyant une nouvelle liste de leurs derniers elements : 

@derniers = popplus ( \@a, \@b, \@c, \@d ); 

sub popplus { 

my @retliste = (); 
for my $reftab (@_) { 

push @retliste, pop @$reftab; 

} 

return @retliste; 

} 

Voici comment vous pourriez ecrire une fonction qui ferait une sorte d'intersection, en 
retoumant la liste des cles apparaissant dans tous les hachages qui lui sont passes : 

@commun = inter ( \%toto, \%titi, \%tutu ); 
sub inter { 
my %vus; 

for my $href (@_) { 

while (my $k = each %$href ) { 
$vus{$k}++; 

} 

} 

return grep { $vus{$_} == @_ } keys %vus; 

} 

Jusqu'ici nous n'avons fait qu'utiliser le mecanisme normal de retour de liste. Que se 
passe-t-il si vous voulez passer ou renvoyer un hachage ? S'il ne s'agit que d'un seul ou 
que cela ne vous gene pas qu'ils soient concatenes, les conventions d'appel habituelles 
conviennent, bien qu'elles soient un peu couteuses. 

Comme nous Favons explique precedemment, les gens commencent a avoir des proble- 
mes avec : 

(@a, @b) = func(@c, @d); 

ou bien : 

(%a, %b) = func(%c, %d); 

Cette syntaxe ne fonctionne tout simplement pas. Elle se contente de tout affecter a @a 
ou %a tout en vidant @b ou %b. De plus la fonction ne recoit pas deux tableaux ou deux 
hachages separes : elle recoit une longue liste dans @_, comme toujours. 

Vous pouvez vous arranger pour que votre fonction prenne des references en parametre 
et en renvoie en resultat. Voici une fonction qui prend deux references de tableau en 
argument et renvoie les deux references de tableaux ordonnees selon le nombre d'ele- 
ments qu'ils contiennent. 

($aref, $bref) = func(\@c, \@d); 
print "@$aref en a plus que @$bref\n"; 
sub func { 

my ($cref, $dref) = 

if (@$cref > @$dref) { 
return ($cref, $dref); 
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} else { 

return ($dref, $cref); 

} 

} 

Pour passer des handles de fichier ou de repertoire a des fonctions ou si vous voulez 
qu'elles en retournent, voir les sections References de handles et References de table de sym- 
boles au chapitre 8. 

Prototypes 

Perl vous permet de definir vos propres fonctions de facon a ce qu'elles soient appelees 
comme les fonctions internes de Perl. Considerez la fonction push(@tableau, $ele- 
ment), qui doit tacitement recevoir une reference a ^tableau, et pas seulement les va- 
leurs de la liste contenues dans ^tableau, afin que le tableau soit effectivement modifie. 
Les prototypes vous permettent de declarer des sous-programmes qui prennent leurs ar- 
guments comme beaucoup de fonctions internes, c'est-a-dire avec certaines contraintes 
au niveau du nombre et du type des arguments. Nous les appelons prototypes mais ils 
fonctionnent comme des modeles automatiques du contexte d'appel plutot que de la 
facon a laquelle penseraient des programmeurs C ou Java quand on leur parle de pro- 
totypes. Avec ces modeles, Perl ajoutera automatiquement des antislashs implicites ou 
des appels a scalar ou ce qu'il faut pour que les choses se presentent de maniere a res- 
pecter le modele fourni. Par exemple, si vous declarez : 

sub monpush (\@@); 

alors monpush prendra ses arguments exactement comme push les prend. Pour que cela 
fonctionne, il faut que la declaration de la fonction soit visible a la compilation. Le pro- 
totype n'affecte l'interpretation des appels de fonction que quand le caractere & est omis. 
En d'autres termes, si vous l'appelez comme une fonction integree, elle se comporte 
comme un fonction integree. Si vous l'appelez comme une bonne vieille routine, elle 
se comporte comme une bonne vieille routine. Le & supprime les verifications de pro- 
totype et les effets contextuels associes. 

Comme les prototypes sont pris en consideration seulement a la compilation, il en de- 
coule naturellement qu'ils n'ont aucune influence sur les references de sous-program- 
me comme \&toto ou sur les appels de sous-programme indirects comme &{$ref sub} 
ou $refsub->(). Les appels de methode ne sont pas non plus influences par les proto- 
types. C'est parce que la veritable fonction a appeler est indeterminee au moment de la 
compilation, puisqu'elle depend de l'heritage, qui est calcule dynamiquement en Perl. 

Comme il s'agit avant tout de permettre de definir des sous-programmes qui fonctionnent 
comme les commandes internes, voici quelques prototypes de fonctions que vous pour- 
riez utiliser pour emuler le fonctionnement des fonctions internes correspondantes : 



Declare comme 


Appele par 


sub monlink ($$) 


monlink $ancien, $nouveau. 


sub monreverse (@) 


monreverse $a,$b,$c. 


sub monjoin ($@) 


monjoin " : ",$a,$b,%c. 


sub monpop (\@) 


monpop @array. 
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Declare comme 


Appele par 


sub monsplice (\@$$@) 
sub monkeys (\%) 
sub monpipe (**) 


monsplice @tableau,(5>tableau,0,|5)pushmoi . 

monkeys %{$hashref}. 

monpipe READHANDLE, WRITEHANDLE. 


sub monindex ($$;$) 


monindex Sgetstring, "substr". 
monindex Sgetstring, "substr", $start. 


sub monsyswrite (*$;$$) 


monsyswrite OUTF, $buf. 

monsyswrite OUTF, $buf, length ($buf)-$off , $off. 


sub monopen (*;$@) 


monopen HANDLE, 
monopen HANDLE, $name. 
monopen HANDLE, "-|", @cmd. 


sub mongrep (&@) 
sub monrand ($) 
sub montime () 


mongrep { /toto/ } $a,$b,$c. 

monrand 42. 

montime. 



Tout caractere de prototype precede d'un antislash (entre parentheses dans la colonne 
de gauche ci-dessus) represente un argument reel (dont la colonne de droite donne un 
exemple) qui doit imperativement commencer par ce caractere. Le premier argument 
de monkeys doit done commencer par un %, tout comme le premier argument de keys. 

Un point-virgule separe les arguments obligatoires des arguments optionnels. (II serait 
redondant devant un @ ou un % puisque les listes peuvent etre vides.) Les caracteres de 
prototype sans antislash ont une signification speciale. Tout caractere @ ou % consomme 
tout le reste des arguments et force un contexte de liste. (II est equivalent a LISTE dans 
un diagramme de syntaxe.) Un argument represente par $force un contexte scalaire. Un 
& requiert une reference a un sous-programme nomme ou anonyme. 

Une * permet au sous-programme d'accepter dans cet emplacement tout ce qui serait 
accepte comme un handle de fichier par une fonction interne : un nom simple, une 
constante, une expression scalaire, un typeglob ou une reference a un typeglob. Si vous 
voulez toujours convertir un tel argument en une reference de typeglob, utilisez Sym- 
bol: :qualify_to_ref comme suit : 

use Symbol 'qualifytoref ' ; 

sub toto (*) { 

my $fh = qualify_to_ref (shift, caller); 

} 

Remarquez que les trois derniers exemples dans le tableau sont traites d'une maniere 
speciale par l'analyseur. mongrep est analyse comme un veritable operateur de liste, mon- 
rand est analyse comme un veritable operateur unaire avec la meme precedence unaire 
que rand et montime ne prend vraiment aucun argument, comme time. 

C'est-a-dire que si vous ecrivez : 



montime +2; 
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vous aurez montimeQ + 2 et non montime(2), qui serait le resultat d'une analyse sans 
prototype ou avec un prototype unaire. 

L'exemple mongrep illustre aussi comment & est traite specialement quand il est le pre- 
mier argument. D'ordinaire, un prototype en & necessiterait un argument comme \&to- 
to ou sub{}. Cependant, quand il est le premier argument, vous pouvez supprimer le 
sub de votre sous-programme anonyme et simplement passer le bloc simple a l'empla- 
cement de l'« objet indirect » (sans virgule apres). L'un des aspects attrayant du proto- 
type & est qu'il permet de generer une nouvelle syntaxe, tant que le & est en premiere 
position : 

sub try (&$) { 

my ($try, $catch) = @_; 
eval { &$try }; 
if ($@) { 

local $_ = $@; 

&$catch; 

} 

} 

sub catch (&) { $_[o] } 

try { 

die "phooey"; 

} # ce n'est pas la fin de l'appel de fonction ! 

catch { 

/phooey/ and print "unphooey\n"; 

}; 

Ceci affiche « unphooey ». Ici, try est appele avec deux arguments, la fonction anonyme 
{die "phooey" ; } et la valeur de retour de la fonction catch, qui dans ce cas n'est rien 
d'autre que son propre argument, tout le bloc d'une autre fonction anonyme. Dans le 
try, la premiere fonction en argument est appelee sous la protection d'un bloc eval 
pour intercepter tout ce qui pourrait exploser. Si quelque chose explose effectivement, 
la seconde fonction est appelee avec une version locale de la variable globale $_ conte- 
nant l'exception qui a ete levee. 3 Si tout cela est du chinois pour vous, vous allez devoir 
vous reporter a die et eval au chapitre 29, puis vous informer au sujet des fonctions 
anonymes et des fermetures au chapitre 8. D'un autre cote, si tout cela vous intrigue, 
vous pouvez jeter un oeil au module Error sur CPAN, qui utilise cette methode pour 
implementer une gestion d'exceptions minutieusement structuree avec les clauses try, 
catch, except, otherwise et finally. 

Voici une reimplementation de l'operateur grep (Poperateur interne est plus efficace, 
bien sur) : 

sub mongrep (&(5)) { 

my $coderef = shift; 



3. Oui, il reste des questions en suspens par rapport a la visibilite de @_. Nous les ignorerons 
pour le moment. Mais si un jour nous rendons @_ a portee lexicale, comme cela se fait actuelle- 
ment dans les versions experimentales de Perl avec des threads, ces sous-programmes anonymes 
pourront se comporter comme des fermetures. 
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my @resultat; 
foreach $_ (@_) { 

push(@resultat, $_) if &$coderef; 

} 

return @resultat; 

} 

Certains prefereraient des prototypes completement alphanumeriques. Les caracteres 
alphanumeriques ont ete intentionnellement laisses en dehors des prototypes dans le 
but avoue d'ajouter un jour des parametres formels nommes. (Peut-etre.) L'objectif ma- 
jeur du mecanisme actuel est de permettre aux auteurs de modules d'imposer un cer- 
tain nombre de verifications a la compilation aux utilisateurs de leurs modules. 



Substitution en ligne defonctions constantes 

Les fonctions prototypees avec (), ce qui signifie qu'elles ne prennent aucun argument, 
sont analysees comme la fonction interne time. Mieux, le compilateur traite de telles 
fonctions comme de bonnes candidates pour la mise en ligne. Si le resultat de cette fonc- 
tion, apres la passe d'optimisation et de precalcul des expressions constantes, est soit une 
constante, soit un scalaire a portee lexicale sans autre reference, alors cette valeur sera 
utilisee au lieu des appels a la fonction. Les appels faits avec MIOM ne sont cependant ja- 
mais mis en ligne, tout comme ils ne sont sujets a aucun autre effet de prototype. (Pour 
une methode simple de declaration de telles constantes, voir le pragma use constant 
au chapitre 31, Modules de pragmas.) 

Les deux versions de ces fonctions calculant it seront mises en ligne par le compilateur : 

sub pi () { 3.14159 } # Pas exact, mais proche 

sub PI () { 4 * atan2(l, l) } # Le mieux qu'on puisse obtenir 

En fait, toutes les fonctions suivantes seront mises en ligne, car Perl peut tout determi- 
ner a la compilation : 

sub FLAGTOTO () { 1 « 8 } 
sub FLAG_TITI () { 1 « 9 } 
sub FLAG_MASK () { FLAGTOTO | FLAG_TITI } 



sub OPTJLORGH () { (OxlB58 & FLAG_MASK) == 0 } 

sub BLORGH_VAL () { 

if (0PT_BL0RGH) { return 23 } 

else { return 42 } 

} 



sub N () { int(BL0RGH_VAL) / 3 } 

BEGIN { # le compilateur execute ce bloc a la compilation 

my $prod = 1; # variable privee, persistante 

for (1 .. N) { $prod *= $_ } 
sub NFACT () { $prod } 

} 

Dans le dernier exemple, la fonction NFACT est mise en ligne car elle a un prototype vide 
et que la variable qu'elle retourne n'est pas modifiee par la fonction — et ne peut plus 
ensuite etre modifiee par personne, puisqu'elle est dans une portee lexicale. Le compi- 
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lateur remplace done toutes les utilisations de NFACT par cette valeur, qui a ete precalcu- 
lee a la compilation grace au BEGIN qui l'entoure. 

Si vous redefinissez un sous-programme qui etait susceptible d'etre mis en ligne, vous 
aurez un avertissement obligatoire. (Vous pouvez vous servir de cet avertissement pour 
savoir si le compilateur a mis en ligne une routine en particulier.) L'avertissement est 
considere suffisament important pour ne pas etre optionnel, car les invocations prece- 
demment compilees de la fonction continueront d'utiliser l'ancienne valeur de la fonc- 
tion. Si vous voulez redefinir la routine, assurez-vous qu'elle n'a pas ete mise en ligne en 
retirant le prototype ( ) (qui change la semantique d'appel, aussi faites attention) ou en 
contrecarrant le mecanisme de mise en ligne d'une autre maniere, comme par exemple : 

sub non_enligne () { 
return 23 if $$; 

} 

Pour en savoir plus sur ce qui se passe durant les phases de compilation et d'execution 
de votre programme, voyez le chapitre 18. 

Precautions a prendre avec les prototypes 

II vaut probablement mieux reserver les prototypes aux nouvelles fonctions et ne pas 
les appliquer a d'anciennes fonctions. Ce sont des descripteurs de contexte, pas des pro- 
types du C ANSI, il vous faut done etre extremement attentif a ne pas imposer silencieu- 
sement un contexte different. Supposez par exemple que vous decidiez qu'une fonction 
ne doit prendre qu'un seul parametre, comme ceci : 

sub func ($) { 
my $n = shift; 

print "vous m'avez donne $n\n"; 

} 

Cela la transforme en operateur unaire (comme l'operateur interne rand) et modifie la 
facon dont le compilateur determine les arguments de la fonction. Avec le nouveau pro- 
totype, la fonction consomme un seul argument en contexte scalaire, au lieu de plu- 
sieurs arguments en contexte de liste. Si quelqu'un l'a appelee avec un tableau ou une 
expression de liste, meme si ce tableau ou cette liste ne contenait qu'un seul element, la 
ou cela marchait vous aurez maintenant quelque chose de completement different : 

func @toto; # compte les elements de @toto 

func split /:/; # compte le nombre d'elements retournes 

func "a", "b", "c"; # passe "a" seulement, le jette avec "b" 

# et retourne "c" 
func("a", "b"j "c"); # soudain, une erreur du compilateur ! 

Vous venez juste de fournir un scalar implicite devant la liste d'arguments, ce qui peut 
etre tres surprenant. Ce n'est pas le vieux @toto qui contenait une seule valeur qui est 
passe. A la place, e'est 1 (le nombre d'elements de @toto) qui est maintenant passe a 
func. Le split, etant appele en contexte scalaire, scribouille partout dans votre liste de 
parametres @_. Dans le troisieme exemple, comme func a ete prototypee comme un 
operateur unaire, seul « a » lui est passe ; puis la valeur de retour de f unc est jetee tandis 
que l'operateur virgule evalue les deux elements suivants et retourne « c ». Dans le der- 
nier exemple, l'utilisateur obtient maintenant une erreur de syntaxe a la compilation, 
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sur du code qui compilait et fonctionnait parfaitement. 

Si vous ecrivez du nouveau code et que vous voudriez un operateur unaire qui ne prend 
qu'une variable scalaire, et pas une expression scalaire, vous pouvez toujours le prototy- 
per pour qu'il prenne une reference a un scalaire : 

sub func (\$) { 

my $nref = shift; 

print "vous m'avez donne $$nref\n"; 



} 

Maintenant le compilateur ne laissera rien passer qui ne commence pas par un dollar : 



Si vous ne faites pas attention, vous pouvez vous attirer des ennuis avec les prototypes. 
Mais si vous faites attention, vous pouvez faire tout un tas de trues classe avec. Tout cela 
est bien sur tres puissant, et ne devrait etre utilise qu'avec moderation pour rendre le 
monde meilleur. 



Une declaration ou une definition de sous-programme peut se voir associer une liste 
d'attributs. Si une telle liste d'attributs est presente, elle sera decoupee en fonction des 
blancs ou des deux-points et traitee comme si un use attributes avait ete vu. Voir le 
pragma use attributes au chapitre 31 pour des details internes. II existe trois attributs 
standards pour les sous-programmes : locked, method et lvalue. 



# Un seul thread est autorise dans cette fonction. 
sub afunc : locked { . . . } 

# Un seul thread est autorise dans cette fonction pour un objet donne. 
sub afunc : locked method { . . . } 

Mettre l'attribut locked n'a de sens que lorsque la fonction ou la methode est supposee 
etre appelee par plusieurs threads simultanement. Quand il est applique a une fonction 
qui n'est pas une methode, Perl s'assure qu'un verrou est mis sur la routine elle-meme 
avant que Ton n'y entre. Quand il est applique a une fonction qui est une methode 
(e'est-a-dire une fonction egalement marquee avec l'attribut method), Perl s'assure que 
toute invocation de cette methode verrouille implicitement son premier argument 
(l'objet) avant l'execution. 



func @toto; 
func split/:/; 
func $s; 
func $a[3]; 
func $h{bazar}[-l]; 
func 2+5; 



# erreur de compilation, voit (9, veut $ 

# erreur de compilation, voit une fonction, veut $ 

# celui-ci va bien ; on a eu un vrai $ 

# celui-ci aussi 

# et meme ca 

# expression scalaire, toujours une erreur de 

# compilation 

# ca marche, mais le remede n'est-il pas pire que 

# le mal ? 



func ${ \(2+5) }; 
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La semantique de ce verrou est la meme qu'en utilisant l'operateur lock dans un sous- 
programme en premiere instruction de ce sous-programme. Pour en savoir plus sur les 
verrous, voir le chapitre 17, Threads. 

L'attribut method peut etre utilise tout seul : 

sub afunc : method { . . . } 

A l'heure actuelle, cela n'a pour seul effet que de marquer la routine de facon a ne pas 
declencher l'avertissement « Ambiguous call resolved as CORE: :%s ». (Nous pour- 
rons lui donner une signification plus importante un de ces jours.) 

Le systeme d'attributs est extensible par l'utilisateur, ce qui vous permet de creer vos 
propres noms d'attribut. Ces nouveaux attributs doivent porter des noms d'identifica- 
teur valides (sans autre caractere de ponctuation que « _ »). Une liste de parametres 
peut y etre ajoutee, pour laquelle n'est verifiee pour le moment que le bon equilibrage 
des parentheses. 

Voici des exemples de syntaxe valide (bien que les attributs soient inconnus) : 

sub fnord (&\%) : switch(lO,foo(7,3)) : expensive; 
sub plugh () : Ugly('\(") :Bad; 
sub xyzzy : _5x5 { . . . } 

Voici des exemples de syntaxe incorrecte : 

sub fnord : switch(lO,toto(); # chaine () desequilibree 
sub snoid : Laid('('); # chaine () desequilibree 

sub xyzzy : 5x5; # "5x5" n'est pas un identif icateur valide 

sub plugh : Y2::nord; # "Y2::nord" n'est pas un identif icateur 

# simple 

sub snurt : toto + titi; # "+" n'est ni un espace ni un deux-points 

La liste d'attributs est passee comme une liste de chames constantes au code qui les as- 
socie avec le sous-programme. La facon exacte dont cela fonctionne (ou ne fonctionne 
pas) est hautement experimentale. Pour des details actuels sur les listes d'attributs et 
leur manipulation, voir attributes(3). 



L'attribut lvalue 

II est possible de renvoyer un scalaire modifiable depuis un sous-programme, mais seu- 
lement si vous declarez que le sous-programme retourne une lvalue : 

my $val; 

sub modifiable : lvalue { 
$val; 

} 

sub nonmodifiable { 
$val; 

} 

modifiableQ =5; # Affecte a $valeur. 
nonmodifiableQ = 5; # ERREUR 

Si vous passez des parametres a un sous-programme lvalue, vous aurez besoin de paren- 
theses pour lever l'ambigui'te sur ce qui est affecte : 
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modifiable $x = 5; # affecte 5 a $x avant ! 

modifiable 42 = 5; # impossible de modifier une constante : erreur 

# de compilation 

modif iable($x) =5; # ceci fonctionne 

modifiable(42) =5; # et cela aussi 

Si vous voulez finasser, vous pouvez contourner cela dans le cas particulier d'une fonc- 
tion ne prenant qu'un seul argument. Declarer la fonction avec le prototype ($) la fait 
analyser avec la precedence d'un operateur unaire nomme. Comme les operateurs unai- 
res nommes ont une precedence superieure a celle de l'affectation, vous n'avez plus be- 
soin de parentheses. (La question de savoir si cela est souhaitable ou pas est laissee a 
l'appreciation de la milice du style.) 

En revanche, vous n'avez pas besoin de finasser dans le cas d'un sous-programme qui ne 
prend aucun argument (c'est-a-dire avec un prototype ( ) ). Vous pouvez sans ambiguite 
ecrire : 

modifiable = 5; 

Cela fonctionne car aucun terme valide ne commence par =. De meme, vous pouvez 
omettre les parentheses dans les appels de methodes lvaluees quand vous ne passez 
aucun argument : 

$obj->modifiable = 5; 

Nous promettons de ne pas casser ces deux constructions dans les prochaines versions 
de Perl. Elles sont pratiques quand vous voulez encapsuler des attributs d'objet dans des 
appels de methodes (de facon a ce qu'ils soient herites comme des appels de methodes, 
mais accessibles comme des variables). 

Le contexte scalaire ou de liste du sous-programme avec l'attribut lvalue et de la partie 
droite d'une affectation a ce sous-programme est dans les deux cas determine en rem- 
placant l'appel de fonction par un scalaire. Considerez par exemple : 

data(2,3) = get_data(3,4); 
Les deux sous-programmes ont ete appeles en contexte scalaire, tandis que dans : 

(data(2,3)) = get_data(3,4); 
et dans : 

(data(2),data(3)) = get_data(3,4); 
tous les sous-programmes sont appeles en contexte de liste. 

L'implementation actuelle ne permet pas a des tableaux ou des hachages d'etre retour- 
nes directement par des sous-programme lvalues. Vous pouvez toujours renvoyer une 
reference a la place. 
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Perl dispose d'un mecanisme pour vous aider a generer des rapports et des tableaux sim- 
ples. Ainsi, Perl vous aide a coder votre page de sortie d'une facon proche de ce a quoi 
elle ressemblera quand elle s'afFichera. II garde trace du nombre de lignes sur la page, 
du numero de page courant, de quand imprimer les en-tetes de page et ainsi de suite. 
Les mots-cles sont empruntes a FORTRAN : format pour les declarer et write pour les 
executer. Voir les sections correspondantes au chapitre 29, Fonctions. Heureusement la 
disposition est beaucoup plus lisible, plus proche du PRINT USING de BASIC. Vous pou- 
vez le voir comme le nroffiX) du pauvre. (Si vous connaissez nroff, ca ne ressemble peut- 
etre pas a un encouragement.) 

Les formats, comme les paquetages et les sous-programmes, sont declares plutot qu'exe- 
cutes, et peuvent done apparaitre n'importe oil dans votre programme. (Bien qu'en ge- 
neral il vaille mieux les regrouper tous ensemble.) lis ont leur propre espace de 
nommage different de ceux de tous les autres types de Perl. Cela signifie que si vous avez 
une fonction nommee « toto », elle n'a rien a voir avec le format nomme « toto ». Ce- 
pendant le nom par defaut du format associe a un handle de fichier donne est le meme 
que le nom de ce handle. Le format par defaut de STDOUT est done nomme « STDOUT », 
et le format par defaut du handle de fichier TEMP est egalement appele « TEMP ». lis ont 
Fair identiques. Mais ils ne le sont pas. 

Les formats d'enregistrement de sortie sont declares de la maniere suivante : 

format NOM = 
FORMLISTE 

If NOM est omis, e'est le format STDOUT qui est defini. FORMLISTE est composee d'une serie 
de lignes, chacun pouvant etre de trois types : 

• un commentaire, indique par une # en premiere colonne ; 

• une ligne « image », donnant le format pour une ligne de sortie ; 

• une ligne d'arguments fournissant les valeurs a inserer dans la ligne d'image prece- 
dente. 
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Les lignes images sont imprimees exactement comme dies apparaissent hormis certains 
champs auxquels sont substitutes des valeurs. 1 Chaque champ de substitution dans une 
ligne image commence, soit par un signe @, soit par un A . Ces lignes ne subissent aucune 
forme d'interpolation de variable. Le champ @ (a ne pas confondre avec le marqueur de 
tableau @) represente le type normal de champ ; Fautre type, A , est utilise pour un rem- 
plissage rudimentaire de blocs de texte multilignes. La longueur du champ est indiquee 
en remplissant le champ avec plusieurs caracteres <, > ou | pour indiquer respective- 
ment la justification a gauche, a droite ou au centre. Si la variable excede la longueur 
specifiee, elle est tronquee. 

Vous pouvez egalement utiliser, comme autre forme de justification a droite, des carac- 
teres # (apres un caractere @ ou A initial) pour specifier un champ numerique. Vous pou- 
vez inserer un . a la place de l'un des caracteres # pour aligner les points decimaux. Si 
l'une des valeurs fournies pour ces champs contient un saut de ligne, seul le texte avant 
ce saut de ligne est imprime. Enfin, le champ special @* peut etre utilise pour imprimer 
des valeurs multilignes de maniere non tronquee ; il devrait generalement apparaitre 
seul sur une ligne image. 

Les valeurs sont specifiers sur la ligne suivante dans le meme ordre que les champs ima- 
ges. Les expressions fournissant les valeurs doivent etre separees par des virgules. Les ex- 
pressions sont toutes evaluees en contexte de liste avant que la ligne ne soit traitee, et 
une seule expression peut done produire plusieurs elements de liste. Les expressions 
peuvent s'etendre sur plusieurs lignes, si elles sont mises entre accolades. (Dans ce cas, 
l'accolade ouvrante doit etre le premier token sur la premiere ligne.) Cela vous permet 
d'aligner les valeurs sous leurs champs de format respectifs pour faciliter la lecture. 

Si 1'evaluation d'une expression donne un nombre avec une partie decimale, et si l'ima- 
ge correspondante specifie que la partie decimale doit apparaitre dans la sortie (e'est-a- 
dire n'importe quelle image sauf une serie de # sans . inclus), le caractere pour le point 
decimal est toujours determine par la valeur de la locale LC_NUMERIC. Cela signifie que 
si l'environnement d'execution specifie par exemple une locale francaise, une virgule 
sera utilisee plutot qu'un point. Pour plus d'information, voir la page de manuel perllo- 
cak. 

A l'interieur d'une expression, les caracteres blancs \n, \t et \f sont tous considered 
comme equivalents a un espace seul. Vous pourriez voir cela comme si le filtre suivant 
etait applique a chaque valeur dans le format : 

$valeur =~ tr/\n\t\f/ /; 

Le caractere blanc restant, \r, force l'affichage d'une nouvelle ligne si la ligne image le 
permet. 

Les champs images qui commencent par A plutot que @ sont traites de maniere speciale. 
Avec un champ #, celui-ci est vide si la valeur est indefinie. Pour les autres types de 
champ, le chapeau permet un genre de mode de remplissage. Au lieu d'une expression 
arbitraire, la valeur fournie doit etre un nom de variable scalaire contenant une chaine 



1. Meme ces champs conservent Fintegrite des colonnes oil vous les mettez. II n'y a rien dans 
une ligne image qui peut faire croitre ou retrecir ou se decaler un champ. Les colonnes que vous 
voyez sont sacrees au sens WYSIWYG (si vous utilisez une fonte a chasse fixe). Meme les caracte- 
res de controle sont supposes avoir une largeur de un. 
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de caracteres. Perl met tout le texte qu'il peut dans le champ, puis coupe le debut de la 
chaine de facon a ce que la fois suivante oil la variable est referencee le reste du texte 
puisse etre imprime. (Oui, cela signifie que le contenu de la variable est altere pendant 
l'execution de l'appel a write et n'est pas preserve. Utilisez une variable temporaire si 
vous voulez preserver la valeur originale.) Normalement, vous devrez utiliser une se- 
quence de champs alignes verticalement pour afficher un bloc de texte. Vous pouvez 
terminer le champ final par le texte «... », qui apparaitra dans la sortie seulement si 
le texte etait trop long pour etre affiche entierement. Vous pouvez modifier les caracte- 
res de « rupture » en modifiant la valeur de la variable $ : 
($FORMAT_LINE_BREAK_CHARACTERS si vous utilisez le module English) en une liste des 
caracteres desires. 

Les champs A peuvent produire des enregistrements de longueur variable. Si le texte a 
formater est court, repetez quelques fois la ligne de format avec le champ A . Si vous fai- 
tes cela pour de courtes donnees, vous obtiendrez quelques lignes blanches. Pour sup- 
primer les lignes qui finiraient blanches, mettez un caractere ~ (tilde) n'importe oil sur 
la ligne. (Le tilde lui-meme est transforme en espace a la sortie.) Si vous mettez un se- 
cond tilde a la suite du premier, la ligne sera repetee jusqu'a ce que tout le texte des 
champs de cette ligne ait ete affiche. (Cela fonctionne car tous les champs A avalent les 
chames qu'ils impriment. Mais si vous utilisez un champ de type @ en conjunction avec 
deux tildes, vous avez interet a ce que l'expression fournie ne renvoie pas perpetuelle- 
ment la meme valeur ! Utilisez un shift ou un autre operateur dont l'un des effets se- 
condaries epuise toutes les valeurs.) 

Le traitement des en-tetes de format est gere par defaut par un format de meme nom 
que le handle de fichier courant, auquel _T0P a ete concatene. II est declenche au debut 
de chaque page. Voir write au chapitre 29. 

Voici quelques exemples : 

# un rapport sur le fichier /etc/passwd 
format STDOUTTOP = 

Fichier Passwd 
Nom Login Bureau Uid Cid Home 



format STDOUT = 

@<<«<<«<«<<«<<< @||||||| @<<«<<@>>» §»» §««««««««< 
$nom, $login, $bureau,$uid,$gid, $home 



# un rapport a partir d'un formulaire de rapport de bogues 
format STDOUTTOP = 

Rapport de bogues 

@<<«<<«<«<<«<<«<«< (5)||| §>>>>»>»»»»>»>>»> 
$systeme, $%, $date 



format STDOUT = 

Sujet : |5)<««««««««««««««««««««<«««««««« 
$suject 
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Index: @<<<<<<<<<<<<<<<<<<<<<<<<<<<< A <«<<«<<«<«<<«<«<<«<<< 

$index, $description 
Priorite: @<<<<<<<<<< Date: @<«<<« A ««««««««««<««<« 

$priorite, $date, $description 

De: @<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<< A «<«<<«<«<<«<<«<«<<«< 

$de, $description 
Assigne a: (?<<<<<<<<<<<<<<<<<<<<<<<< A <«<<«<<«<«<<«<«<<«<<< 
$programmeur, $description 

A <<«<<«<<«<<«<<«<«<<«< 
$description 

A <<«<<«<<«<<«<<«<«<<«< 
$description 

A <<«<<«<<«<<«<<«<«<<«< 
$description 

A <<«<<«<<«<<«<<«<«<<«< 
$description 

A <<«<<«<<«<<«<<«<«. . . 
$description 

Les variables lexicales ne sont pas visibles dans un format sauf si le format est declare 
dans la portee de la variable lexicale. 

II est possible de melanger des appels a print et a write sur le mime canal de sortie, 
mais il vous faudra gerer la variable speciale $- ($FORMAT_LINES_LEFT si vous utilisez le 
module English) vous-meme. 

Variables de format 

Le nom de format en cours est stocke dans la variable $~ ($FORMAT_NAME), et le nom de 
l'en-tete de format en cours dans $ A ($F0RMAT_T0P_NAME). Le numero de page de sortie 
courant est stocke dans $% ($FORMAT_PACE_NUMBER), et le nombre de lignes dans la page 
se trouve dans $= ($FORMAT_LINES_PER_PACE). Le vidage automatique du tampon de sor- 
tie de ce handle est positionne dans $| ($OUTPUT_AUTOFLUSH). La chame a sortie avant 
chaque en-tete de page est stockee dans $ A L ($FORMAT_FORMFEED). Ces variables sont po- 
sitionnees pour chaque handle de fichier, aussi devrez-vous faire un select sur le han- 
dle de fichier associe a un format pour modifier ses variables de format : 

select((select(OUTF), 

$~ = "Mon_Autre_Format", 
$ A = "Mon_Entete_de_Format" 

)[o]); 

C'est bien moche, hein ? C'est cependant un idiome commun, aussi ne soyez pas trop 
surpris en le voyant. Vous pouvez au moins utiliser une variable temporaire pour con- 
server le handle de fichier precedent : 

$ofh = select (OUTF); 
$~ = "Mon_Autre_Format"; 
$ A = "Mon_Entete_de_Format"; 
select($ofh); 



Variables de format 



217 



Non seulement c'est une meilleure approche en general, car cela ameliore la lisibilite 
du code, mais vous avez maintenant en plus une instruction intermediate oil s'arreter 
dans le code avec un debogueur en pas a pas. Si vous utilisez le module English, vous 
pouvez meme lire le nom des variables : 

use English; 

$ofh = select(OUTF); 

$FORMAT_NAME = "Mon_Autre_Format"; 

$F0RMAT_T0P_NAME = "Mon_Entete_de_Format"; 

select($ofh); 

Mais il vous reste quand meme ces appels bizarres a select. Si vous voulez les eviter, 
utilisez le module FileHandle fourni avec Perl. Maintenant vous pouvez acceder a ces 
variables speciales en utilisant des noms de methodes en minuscules a la place : 

use FileHandle; 

OUTF- >f ormat_name( "Mon_Autre_Format " ) ; 
OUTF->format_top_name("Mon_Entete_de_Format"); 

C'est quand meme mieux ! 

Comme la ligne de valeurs qui suit votre ligne image peut contenir des expressions ar- 
bitraires (pour les champs @, pas pour les champs A ), vous pouvez passer les traitements 
plus compliques a d'autres fonctions, comme printf ou une de vos propres fonctions. 
Par exemple pour inserer des virgules dans un nombre : 

format Ident = 

@<<«<«<<«<<« 
commify($n) 

Pour afficher un vrai @, ~ ou A dans un champ, faites comme ceci : 

format Ident = 
D'ai un @ ici. 
"@" 

Pour centrer tout une ligne de texte, faites quelque chose comme cela : 
format Ident = 

I II I II II I II II II II II II II II II I II II 
"Une ligne de texte" 

L'indicateur de longueur de champ > garantit que le texte sera justifie a droite dans le 
champ, mais le champ lui-meme se place exactement ou vous l'avez place. II n'existe pas 
de maniere integree de dire « mets ce champ a droite de la page, quelle que soit sa 
largeur ». Vous devez specifier oil il se trouve relativement a la marge de gauche. Ceux 
qui sont vraiment desesperes peuvent generer leur propre format au vol, en s'appuyant 
sur le nombre courant de colonnes (non fourni) et puis faire un eval : 

$format = "format STDOUT = \n" 

. ' A ' . '<' x $cols . "\n" 
. gentry' . "\n" 

. "\t A " . "<" x ($cols-8) . "~~\n" 
. gentry' . "\n" 
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. "An"; 
print $format if $Debug; 
eval $format; 
die $@ if $@; 

La ligne la plus importante est probablement celle du print. Ce qu'il imprime ressem- 
ble a ceci : 

format STDOUT = 

A <<«<<«<«<<«<<«<«<<«<«<<«<<«<«««««<<<«<<«< 
$entry 

A <<«<«<<«<<«<«<<«<«<<«<<«<«««««<<<«<~~ 
$entry 

Void un petit programme qui se comporte comme Futilitaire Unix fmt{\) : 
format = 

A <<«<<«<«<<«<<«<«<<«<«<<«<<«<«««« ~~ 
$_ 



$/ = ""• 
while (<>) { 

s/\s*\n\s*/ /g; 

write; 

} 

Pieds de page 

Alors que $ A ($F0RMAT_T0P_NAME) contient le nom du format d'en-tete courant, il n'exis- 
te pas de mecanisme correspondant pour les pieds de page. L'un des problemes majeurs 
est de ne pas savoir quelle sera la taille d'un format avant de l'avoir evalue. C'est dans la 
liste des choses a faire. 2 

Voici une strategic : si vous avez un pied de page de taille fixe, vous pouvez Fafficher en 
verifiant $- ($FORMAT_LINES_LEFT) avant chaque write puis afficher le pied de page si 
necessaire. 

Voici une autre strategic : ouvrez un tube sur vous-meme, en utilisant open(MOIMEME, 
" | - " ) (voir l'entree open au chapitre 29) et faites toujours des write sur MOIMEME au lieu 
de STDOUT. Le processus fils devra traiter son STDIN apres coup pour rearranger ses en- 
tetes et pieds de page a votre guise. Pas tres pratique, mais faisable. 



2. Bien sur, cela ne garantit en rien que ce sera fait un jour. Les formats sont quelque chose d'un 
peu depasse en cet age du WWW, de l'Unicode, du XML, du XSLT et toutes les autres choses 
qu'on inventera apres tout ca. 



Pieds de page 



219 



Acces au mecanisme interne deformatage 

Pour acceder au mecanisme interne de formatage, vous pouvez utiliser Foperateur inte- 
gre f ormline et acceder a $ A A (la variable $ACCUMULATOR) directement. Par exemple : 

$str = formline <<'END', 1,2,3; 

@<« @||| @»> 
END 

print "Wouah, je viens juste de mettre ~$ A A J dans l'accumulateur !\n"; 

Ou pour creer un sous-programme swrite qui serait a write ce que sprintf est a 
printf : 

use Carp; 
sub swrite { 

croak "usage: swrite IMAGE ARGS" unless @_; 

my $format = shift; 

$ A A = ""; 

formline($format, @_); 
return $ A A; 

} 

$chaine = swrite(<<-' END' , l, 2, 3); 
Verif iez-moi 

@«< @||| §»> 
END 

print $chaine; 

Si vous utilisiez le module FileHandle, vous pourriez utiliser formline comme suit 
pour passer a la ligne a la colonne 72 : 

use FileHandle; 

STDOUT->formline(" A " . ("<" x 72) . "~~\n", $long_texte); 
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Pour des raisons tant philosophiques que pratiques, Perl a toujours favorise les structu- 
res de donnees plates et lineaires. Et pour beaucoup de problemes, c'est exactement ce 
dont vous avez besoin. 

Imaginez que vous vouliez construire une table simple (un tableau a deux dimensions) 
listant certaines informations anthropometriques — age, couleur des yeux, poids — 
concernant un groupe de personnes. Vous pourriez faire cela en creant un tableau pour 
chaque individu : 

Iffljohn = (47, "marron", 84); 
@mary = (23, "noisette", 58); 
gbill = (35, "bleu", 71); 

Vous pourriez ensuite construire un simple tableau supplemental contenant les noms 
des autres tableaux : 

(Sinfos = ('john', 'mary', 'bill'); 

Pour changer la couleur des yeux de John en « rouge » apres une viree en ville, il nous 
faut un moyen de changer le contenu de @john a partir de la simple chaine « john ». 
C'est le probleme classique des indirections, que differents langages resolvent de diffe- 
rentes manieres. En C, la forme la plus courante d'indirection est le pointeur, qui per- 
met a une variable de contenir l'adresse en memoire d'une autre variable. En Perl, la 
forme la plus courante d'indirection est la reference. 

Qu'est-ce qu'une reference ? 

Dans notre exemple, $infos[o] contient la valeur « john ». C'est-a-dire qu'il contient 
une chaine qui se trouve etre le nom d'une autre variable (globale). On dit que la pre- 
miere variable se refere a la seconde ; cette sorte de reference est appelee symbolique, puis- 
que Perl doit rechercher @john dans une table de symboles pour le retrouver. (Vous 
pouvez voir les references symboliques comme analogues aux liens symboliques d'un 
systeme de fichiers.) Nous parlerons des references symboliques un peu plus loin dans 
ce chapitre. 
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L'autre type de references sont les references en dur (hard references), qui constituent ce 
que les programmeurs Perl utilisent le plus souvent pour accomplir leurs indirections 
(quand ce ne sont pas leurs indiscretions). Nous les appelons references en dur non pas 
parce qu'elles sont compliquees, mais parce qu'elles sont reelles et solides. Si vous prefe- 
rez, vous pouvez voir les references en dur comme de vraies references et les references 
symboliques comme de fausses references. C'est un peu comme la difference entre avoir 
des amis et avoir des relations. Quand nous ne precisons pas de quel type de reference 
nous parlons, il s'agit de references en dur. La figure 8-1 presente une variable nommee 
$titi faisant reference au contenu d'une variable nommee $toto qui a la valeur 
« robot ». 




$toto = "bot" 



$titi = "toto" 



Figure 8-1. Une reference en dur et une reference symbolique 

Contrairement aux references symboliques, une vraie reference ne se refere non pas au 
nom d'une autre variable (qui n'est que le conteneur d'une valeur), mais a la valeur elle- 
meme, un bout de donnee interne. Il n'y a pas de mot pour decrire cela, mais quand il 
le faut nous l'appellerons le referent. Supposez par exemple que vous creez une reference 
en dur vers le tableau a portee lexicale ^tableau. Cette reference en dur, et le referent 
auquel elle se refere, continueront d'exister meme quand ^tableau sera hors de portee. 
Un referent n'est detruit que quand toutes les references qui pointent sur lui ont ete eli- 
minees. 

Un referent n'a pas vraiment de nom propre, en dehors des references qui s'y referent. 
Pour le dire d'une autre facon, chaque variable Perl vit dans une sorte de table de sym- 
boles, qui contient une reference vers le referent sous-jacent (qui lui n'a pas de nom). Le 
referent peut etre simple, comme un nombre ou une chaine, ou complexe, comme un 
tableau ou un hachage. Dans tous les cas, il y a toujours exactement une reference de la 
variable a sa valeur. Vous pouvez eventuellement creer de nouvelles references en dur 
vers le meme referent, mais si vous le faites, la variable elle-meme n'en sait rien (et s'en 
moque). 1 

Une reference symbolique est juste une chaine qui se trouve etre le nom de quelque 
chose dans la table des symboles. Ce n'est pas tellement un type distinct, mais plutot 
quelque chose que vous faites avec une chaine. Alors qu'une reference en dur est une 
creature completement differente. C'est le troisieme des trois types scalaires fondamen- 
taux, les deux autres etant les chaines et les nombres. Une reference en dur n'a pas be- 



1. Si vous etes curieux, vous pouvez vous servir du module Devel : : Peek, fourni avec Perl, pour 
determiner la valeur du compteur de references sous-jacent. 
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soin de connaitre le nom de quelque chose pour pointer dessus, et en fait il est 
completement normal qu'il n'y ait pas de nom a utiliser du tout. De tels referents sans 
nom du tout sont anonymes ; nous en parlons dans la partie Donnees anonymes ci-des- 
sous. 

Referencer une valeur, dans la terminologie de ce chapitre, consiste a creer une reference 
en dur vers elle. (II existe un operateur special pour cette action creatrice.) La reference 
ainsi creee est un simple scalaire, qui se comporte dans les situations usuelles comme 
n'importe quel autre scalaire. Dereferencer ce scalaire signifie utiliser la reference pour 
obtenir le referent. Le referencement et le dereferencement se produisent quand vous 
invoquez des mecanismes explicites ; il ne se produit jamais de referencement ou de de- 
referencement implicites en Perl. Enfin, presque jamais. 

Un appel de fonction peut passer implicitement des references — si elle a un prototype 
qui la declare ainsi. Dans ce cas, l'appelant de la fonction ne passe pas explicitement une 
reference, bien qu'il vous faille toujours dereferencer explicitement celle-ci a l'interieur 
de la fonction. Voir la section Prototypes au chapitre 6, Sous-programmes. Et pour etre to- 
talement honnete, il se produit aussi des dereferencements en coulisses quand vous uti- 
lisez certains types de handles de fichiers. Mais cela releve de la compatibility anterieure 
et reste transparent pour l'utilisateur lambda. Finalement, deux fonctions internes, 
bless et lock, prennent toutes deux une reference en argument mais la dereferenced 
implicitement pour faire leurs manipulations sur ce qui se cache derriere. Ces indiscre- 
tions admises, le principe selon lequel Perl n'a pas envie de toucher a vos niveaux d'in- 
directions tient toujours. 

Une reference peut pointer sur n'importe quelle structure de donnees. Comme les refe- 
rences sont des scalaires, vous pouvez les stocker dans des tableaux et des hachages, et 
ainsi construire des tableaux de tableaux, des tableaux de hachages, des hachages de ta- 
bleaux, des tableaux de hachages de fonctions, et ainsi de suite. Vous trouverez des 
exemples de cela dans le chapitre 9, Structures de donnees. 

Gardez cependant a l'esprit que les tableaux et les hachages de Perl sont a une dimen- 
sion en interne. C'est-a-dire que leurs elements ne peuvent contenir que des valeurs sca- 
laires (chaines, nombres et references). Quand nous disons quelque chose comme 
« tableau de tableaux », nous pensons en fait « tableau de references a des tableaux », 
tout comme nous pensons « hachage de references a des fonctions » quand nous disons 
« hachage de fonctions ». Mais comme les references sont la seule facon d'implementer 
de telles structures en Perl, il s'ensuit que l'expression plus courte et moins precise n'est 
tout de meme pas fausse, et ne devrait done pas etre totalement denigree, a moins que 
vous ne soyez maniaque. 

Creation de references 

II existe plusieurs facons de creer des references, dont nous decrirons la plupart avant 
d'expliquer comment utiliser (dereferencer) les references resultantes. 

L'operateur antislash 

Vous pouvez creer une reference a une variable nommee ou a un sous-programme gra- 
ce a un antislash. (Vous pouvez aussi vous en servir sur une valeur scalaire anonymes 
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comme 7 ou "chameau", bien que cela soit rarement necessaire.) Cet operateur fonction- 
ne comme l'operateur & (adresse de) en C — du moins a premiere vue. 

Voici quelques exemples : 

$refscalaire = \$toto; 

$refconst = \186_282.42; 

$reftableau = \(5)ARGV; 

$refhash = \%ENV; 

$refcode = \&handler; 

$refglob = \*STD0UT; 

L'operateur antislash peut faire bien plus que de creer de simples references. II creera 
toute une liste de references s'il est applique a une liste. Pour plus de details, voir la sec- 
tion D'autres tours avec les references en dur. 



Donnees anonymes 



Dans les exemples que nous venons de vous montrer, l'operateur antislash se contente 
de dupliquer une reference qui est deja contenue dans un nom de variable — avec une 
exception. Le 186_282 .42 n'est reference par aucune variable — c'est juste une valeur. 
C'est l'un de ces referents anonymes que nous avons mentionnes precedemment. On ne 
peut acceder aux referents anonymes qu'a travers des references. Celui-ci est un nombre, 
mais vous pouvez aussi bien creer des tableaux anonymes, des hachages anonymes et 
des sous-programmes anonymes. 

Le composeur de tableaux anonymes 

Vous pouvez creer une reference a un tableau anonyme en employant des crochets : 

$reftableau = [l, 2, ['a', 'b' , 'c', 'd']]; 

Ici nous avons construit un tableau anonyme de trois elements, dont le dernier element 
est une reference a un tableau anonyme a quatre elements (decrit a la figure 8-2). (La 
syntaxe multidimensionnelle decrite plus loin peut etre utilisee pour y acceder. Par 
exemple, $reftableau->[2] [l] aurait la valeur « b ».) 




Figure 8-2. Une reference d un tableau, dont le troisieme element est lui-meme une reference 

de tableau 

Nous avons maintenant une methode pour representer la table du debut de ce 
chapitre : 
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$table = [ [ "john", 47, "marron", 84], 
[ "mary", 23, "noisette", 58], 
[ "bill", 35, "bleu", 71] ]; 

Les crochets fonctionnent de cette facon seulement quand Fanalyseur de Perl attend un 
terme dans une expression. lis ne doivent pas etre confondus avec les crochets dans une 
expression comme $tableau[6] — bien que l'association mnemotechnique avec les ta- 
bleaux soit volontaire. A Finterieur d'une chaine entre guillemets, les crochets ne pro- 
voquent pas la creation de tableaux anonymes ; ils deviennent simplement des 
caracteres litteraux dans la chaine. (Les crochets fonctionnent toujours pour l'indexa- 
tion a l'interieur de chames, sinon vous ne pourriez pas afficher des valeurs comme 
"VAL=$tableau[6]\n". Et pour etre tout a fait honnete, vous pouvez en fait glisser des 
composeurs de tableaux anonymes dans une chaine, mais seulement s'ils sont inclus 
dans une expression plus grande qui est interpolee. Nous parlerons de cette fonctionna- 
lite sympathique un peu plus loin dans ce chapitre, car elle implique du dereference- 
ment aussi bien que du referencement.) 

Le composeur de hachages anonymes 

Vous pouvez creer une reference a un hachage anonyme avec des accolades : 

$hashref = { 

'Adam' => 'Eve', 
'Clyde' => $bonnie, 
'Antoine' => 'Cleo' . 'patre', 

}; 

Vous pouvez librement melanger les composeurs d'autres tableaux, hachages ou sous- 
programmes anonymes pour les valeurs (mais pas pour les cles) afin de construire une 
structure aussi compliquee que vous le souhaitez. 

Nous avons maintenant une nouvelle maniere de representer la table du debut de ce 
chapitre : 

$table = { 

"john" => [ 47, "marron", 84 ], 
"mary" => [ 23, "noisette", 58 ], 
"bill" => [ 35, "bleu", 71 ], 

}; 

C'est un hachage de tableaux. Le choix de la meilleure structure est une affaire delicate, 
et le prochain chapitre y est entierement dedie. Mais pour vous faire saliver, nous pou- 
vons meme utiliser un hachage de hachages pour notre table : 

$table = { 

"john" => { age => 47, 

yeux => "marron", 

poids => 84, 

}, 

"mary" => { age => 23, 

yeux => "noisette", 

poids => 58, 
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"bill" => { age => 35, 

yeux => "bleu", 
poids => 71, 

}, 

}; 

Comme avec les crochets, les accolades fonctionnent de cette facon uniquement quand 
Perl attend un terme dans une expression. II ne faut pas les confondre avec les accolades 
dans une expression comme $hash{cle} — bien que l'association mnemotechnique 
soit (encore) volontaire. Les memes avertissements s'appliquent quant a l'utilisation des 
accolades a l'interieur d'une chaine. 

Voici un avertissement supplementaire qui ne s'appliquait pas aux crochets. Comme les 
accolades sont aussi utilisees pour plusieurs autres choses (y compris les blocs), vous 
pourrez occasionnellement avoir besoin de distinguer les accolades au debut d'une ins- 
truction en mettant un + ou un return devant, afin que Perl realise que ce n'est pas un 
bloc qui commence. Par exemple, si vous voulez une fonction qui cree un nouveau ha- 
chage et renvoie une reference sur lui, vous avez les possibilites suivantes : 

sub hacheles { { @_ } } # Silencieusement FAUX -- renvoie @_. 

sub hacheles { +{ @_ } } # Ok. 

sub hacheles { return { @_ } } # Ok. 

Le composeur de sous-programmes anonymes 

Vous pouvez creer une reference a un sous-programme anonyme en utilisant sub sans 
nom de sous-programme : 

$refcode = sub { print "Boink!\n" }; # Maintenant &$refcode affiche 
"Boink!" 

Remarquez la presence du point-virgule, qui est obligatoire pour terminer l'expression. 
(II ne le serait pas apres la declaration usuelle sub/VOM{} qui declare et definit un sous- 
programme nomme.) Hormis le fait que le code a l'interieur n'est pas execute immedia- 
tement, un sub { } sans nom est plus un operateur qu'une declaration — comme do { } 
ou eval {}. II se contente de generer une reference au code, qui dans notre exemple est 
stockee dans $ref code. Cependant, quel que soit le nombre de fois que vous executez la 
ligne ci-dessus, $ref code se referera toujours au meme sous-programme anonyme. 2 

Constructeurs d'objets 

Les sous-programmes peuvent aussi renvoyer des references. Cela peut sembler banal, 
mais vous etes parfois cense vous servir d'un sous-programme pour renvoyer une refe- 
rence, plutot que de creer la reference vous-meme. En particulier, des sous-programmes 
speciaux appeles constructeurs creent et renvoient des references sur des objets. Un objet 
est juste un type special de reference qui sait a quelle classe il est associe ; les construc- 
teurs savent creer ce genre d'association. lis les creent en prenant un referent ordinaire 



2. Mais bien qu'il n'y ait qu'un seul sous-programme anonyme, il peut y avoir plusieurs copies 
des variables lexicales utilisees par le sous-programme, selon le moment oil la reference a ete 
generee. Cela sera aborde plus loin dans la section Fermetures. 
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et en le transformant en objet grace a l'operateur bless (qui signifie « benir » en an- 
glais), c'est pourquoi nous pouvons parler d'objets comme de references consacrees. II 
n'y a rien de religieux dans tout cela ; etant donne qu'une classe fonctionne comme un 
type defini par l'utilisateur, consacrer un referent en fait un type utilisateur en plus d'un 
type predefini. Les constructeurs sont souvent nommes new — en particulier par les 
programmeurs C++ — mais en Perl on peut les appeler comme on veut. 

Les constructeurs peuvent etre appeles de n'importe laquelle de ces manieres : 

$refobj = Chien: : ->new(Queue => 'courte', Oreilles => 'longues'); #1 

$refobj = new Chien:: Queue => 'courte', Oreilles => 'longues'; #2 

$refobj = Chien->new(Queue => 'courte', Oreilles => 'longues'); #3 

$refobj = new Chien Queue => 'courte', Oreilles => 'longues''; #4 

La premiere et la deuxieme invocations sont identiques. Toutes deux appelent une fonc- 
tion nommee new qui est fournie par le module Chien. Les troisieme et quatrieme invo- 
cations sont identiques aux deux premieres mais sont legerement plus ambigues : 
l'analyseur va se tromper si vous avez defini votre propre fonction new et que vous n'avez 
fait ni de require, ni de use, sur le module Chien, chacun des deux ayant pour effet de 
declarer le module. Declarez toujours vos modules si vous voulez utiliser la methode 
numero 4. (Et faites attention aux sous-programmes Chien errants.) 

Voir le chapitre 12, Objets, pour une discussion sur les objets Perl. 

References de handles 

Les references a un handle de fichier ou de repertoire peuvent etre creees en prenant 
une reference a un typeglob de meme nom : 

bafouille(\*STDOUT); 

sub bafouille { 
my $fh = shift; 

print $fh "heu hum he bien a hmmm\n"; 

} 

$rec = get_rec(\*STDIN); 
sub get_rec { 

my $fh = shift; 

return scalar <$fh>; 

} 

Si vous faites circuler des handles de fichier, vous pouvez aussi utiliser le typeglob seul 
pour le faire : dans l'exemple ci-dessus, vous auriez pu utiliser *STD0UT ou *STDIN au lieu 
de \*STD0UT et \*STDIN. 

Bien que vous puissiez en general indifferement utiliser les typeglobs et les references 
de typeglob, il y a quelques cas oil vous ne pouvez pas. Les typeglobs simples ne peuvent 
pas etre consacres (avec bless) en objets et les references de typeglobs ne peuvent etre 
passees en dehors de la portee d'un typeglob localise. 

Pour generer de nouveaux handles de fichiers, du code ancien ferait plutot des choses 
comme ceci pour ouvrir une liste de fichiers : 
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for $fichier (@noms) { 
local *FH; 

open(*FH, $fichier) | | next; 
$handle{$fichier} = *FH; 

} 

Ca marche encore, mais de nos jours il est aussi facile de laisser une variable non definie 
s'autovivifier en typeglob anonyme : 

for $fichier (@names) { 
my $fh; 

open($fhj $fichier) | | next; 
$handle{$fichier} = $fh; 

} 

Avec les handles de fichiers indirects, que vous utilisiez des typeglobs, des references de 
typeglob ou l'un des objets d'E/S plus exotiques n'a aucune importance. Vous utilisez 
simplement un scalaire qui — d'une maniere ou d'une autre — sera interprets comme 
un handle de fichier. Dans la plupart des cas, vous pouvez utiliser un typeglob ou une 
reference a un typeglob presque aleatoirement. Comme nous l'avons reconnu plus tot, 
ce qui se passe ici, c'est la magie du dereferencement implicite. 

References de table de symboles 

Dans des circonstances inhabituelles, vous pourriez ne pas savoir de quel type de refe- 
rence vous aurez besoin au moment oil vous ecrivez votre programme. Une reference 
peut etre creee en utilisant une syntaxe speciale connue affectueusement sous le nom 
de syntaxe *foo{ THING} (en anglais dans le texte). *toto{CHOSE} (enfrancais dans le texte) 
retourne une reference a la case CHOSE de *toto, qui est Fentree de la table de symbole 
contenant les valeurs de $toto, @toto, %toto et tous leurs amis. 

$refscalaire = *toto{SCALAR}; # Meme chose que \$toto 

$reftableau = *ARGV{ ARRAY}; # Meme chose que \@ARGV 

$refhash = *ENV{HASH}; # Meme chose que \%ENV 

$refcode = *handler{CODE}; # Meme chose que \&handler 

$refglob = *toto{GL0B}; # Meme chose que \*toto 

$refio = *STDIN{I0}; # Euh... 

Les noms parlent d'eux-memes, sauf dans le cas de *STDIN{I0}. II contient Fobjet inter- 
ne 10: : Handle que le typeglob contient, c'est-a-dire la partie du typeglob qui interesse 
veritablement les differentes fonctions d'entree/sortie. Pour assurer la compatibility 
avec les anciennes versions de Perl, *toto{FILEHANDLE} est un synonyme de la notation 
*toto{10} a la mode. 

En theorie, vous pouvez utiliser un *HANDLE{ 10} partout oil vous auriez utilise un *HAN- 
DLE ou un \*HANDLE, comme par exemple pour passer des handles a des fonctions ou 
pour en retourner, ou pour les stacker dans des structures plus grandes. (En pratique il 
reste encore quelques obstacles a aplanir.) Leur avantage est qu'ils accedent uniquement 
au veritable objet d'E/S qui vous interesse et pas a tout le typeglob, done vous ne courez 
pas le risque de defaire plus de choses que vous ne voulez par une affectation de type- 
glob (mais si vous voulez assigner a une variable scalaire au lieu d'un typeglob, cela ne 
posera pas de probleme). Un des inconvenients est qu'il n'est pas possible d'en autovivi- 
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fier a l'heure actuelle. 3 

bafouille(*STDOUT); 
bafouille(*STDOUT{IO}); 

sub bafouille { 
my $fh = shift; 

print $fh "heu hum he bien a hmmm\n"; 

} 

Les deux invocations de bafouille () affichent « heu hum he bien a hmmm ». 

*toto{CHOS£} renvoie undef si cette CHOSE en particulier n'a pas encore ete vue par le 
compilateur, sauf si CHOSE vaut SCALAR. II se trouve que *toto{ SCALAR} renvoie une re- 
ference a un scalaire anonyme meme si $toto n'a pas encore ete vu. (Perl ajoute tou- 
jours le scalaire au typeglob pour optimiser un bout de code ailleurs. Mais ne supposez 
pas que cela restera ainsi dans les prochaines versions.) 

Creation implicite de references 

Une derniere methode de creation de references n'en est pas vraiment une. Les referen- 
ces d'un certain type se mettent simplement a exister quand vous les dereferencez dans 
un contexte de lvalue qui suppose qu'elle existent. Cela est extremement utile, et c'est 
aussi Ce a Quoi On s'Attend. Ce sujet est traite plus loin dans ce chapitre, quand nous 
verrons comment dereferencer toutes les references que nous avons creees jusqu'ici. 

Utilisation des references en dur 

Tout comme il existe de nombreuses manieres de creer des references, il existe egale- 
ment plusieurs manieres d'utiliser, ou de dereferencer une reference. II existe un seul 
principe superieur : Perl ne fait pas de referencement ou de dereferencement implicite. 4 
Quand un scalaire contient une reference, il se comporte comme un simple scalaire. Il 
ne devient pas magiquement un tableau ou un hachage ou un sous-programme ; vous 
devez lui signifier explicitement de le faire, en le dereferencant. 

Emploi d'une variable comme nom de variable 

Quand vous rencontrez un scalaire comme $toto, vous devriez penser « la valeur scalai- 
re associee a toto ». C'est-a-dire qu'il y a une entree toto dans la table des symboles et 
que le drole de caractere $ est une maniere de regarder quelle valeur scalaire se trouve 
a l'interieur. Si ce qui se trouve a l'interieur est une reference, vous pouvez regarder a 
l'interieur de cette reference (dereferencer $toto en le faisant preceder d'un autre drole 
de caractere. Ou en le regardant du point de vue oppose, vous pouvez remplacer le toto 
litteral dans $toto par une variable scalaire qui pointe sur le veritable referent. Cela est 



3. Aujourd'hui, open my $fh autovivifie un typeglob au lieu d'un objet 10: : Handle ; mais un 
des ces jours nous corrigerons cela, aussi ne devriez vous pas vous fier au fait qu'open autovivifie 
actuellement un typeglob. 

4. Nous avons deja reconnu que c'etait un petit mensonge. Nous n'allons pas recommencer. 
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vrai pour tout type de variable, done non seulement $$toto est la valeur scalaire de ce 
a quoi $toto se refere, mais @$titi est la valeur tableau de ce a quoi $titi se refere, 
%$tutu est la valeur hachage de ce a quoi $tutu se refere, et ainsi de suite. Le resultat est 
que vous pouvez rajouter un drole de caractere devant n'importe quelle valeur scalaire 
pour la dereferencer : 

$toto = "trois bosses"; 

$refscalaire = \$toto; # $refscalaire est maintenant une 

# reference a $toto 

$type_chameau = $$ref scalaire; # $type_chameau vaut maintenant "trois 

# bosses" 

Voici d'autres dereferences : 
$titi = $$refscalaire; 

push(@$ref tableau, $fichier); 

$$ref tableau [0] = "Danvier"; # Affecte le premier element 

# de @$reftableau 

@$ref tableau [4. .6] = qw/Mai Duin Duillet/; # Affecte plusieurs elements 

# de @$reftableau 

%$refhash = (CLE => "TROUSSEAU", OISEAU => "SIFFLER"); # Initialise tout 

# le hash 

$$refhash{CLE} = "VALEUR"; # Change un couple cle/valeur 

@$refhash{"CLEl","CLE2"} = ("VAL1", "VAL2"); # Ajoute deux nouveaux couples 

&$refcode(l,2,3); 

print $refhandle "sortie\n"; 

Cette forme de dereferencement ne peut utiliser qu'une variable simple (sans indice). 
C'est-a-dire que le dereferencement se produit avant (ou lie plus fort que) toute recher- 
che dans un tableau ou un hachage. Utilisons des accolades pour clarifier notre pensee : 
une expression comme $$reftableau[o] est equivalente a ${$reftableau}[0] et signi- 
fie le premier element du tableau reference par $reftableau. Ce n'est pas du tout la 
meme chose que ${$reftableau[o]} qui dereference le premier element du tableau 
nomme @ref tableau (et qui n'existe probablement pas). De meme, $$ref hash{CLE} est 
equivalent a ${$ref hash}{CLE} et n'a rien a voir avec ${$ref hash{CLE}} qui dereferen- 
cerait une entree du hachage nomme %ref hash (qui n'existe probalement pas). Vous se- 
rez malheureux tant que vous n'aurez pas compris cela. 

Vous pouvez realiser plusieurs niveaux de referencement et de dereferencement en con- 
catenant les droles de caracteres de facon appropriee. Ce qui suit affiche « salut » : 

$refrefref = WV'salut"; 
print $$$$refrefref; 

Vous pouvez voir les dollars comme operant de droite a gauche. Mais le debut de la chai- 
ne doit toujours etre un simple scalaire sans indice. II existe cependant une technique 
qui met un peu plus de fantaisie, que nous avons deja subrepticement utilisee un peu 
plus tot, et que nous allons expliquer dans la section suivante. 
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Emploi d'un BLOC comme nom de variable 

Non seulement vous pouvez dereferencer un simple nom de variable, mais vous pouvez 
aussi dereferencer le contenu d'un BLOC. Partout oil vous mettriez un identificateur 
comme partie d'une variable ou d'un nom de sous-programme, vous pouvez remplacer 
l'identificateur par un BLOC qui renvoie une reference du bon type. En d'autres termes, 
tous les exemple precedents peuvent etre clarifies comme suit : 

$titi = ${$refscalaire}; 
push(|5){$reftableau} J $fichier); 
${$reftableau}[0] = "Danvier"; 
(5){$reftableaii}[4. .6] = qw/Mai Duin Duillet/; 
${$refhash}{"CLE"} = "VALEUR"; 
@{$refhash}{"CLEl","CLE2"} = ("VAL1","VAL2"); 
&{$refcode}(l,2,3)j 
sans oublier : 

$refrefref = WV'salut"; 
print ${${${$refrefref}}}; 

Nous sommes d'accord qu'il est idiot de mettre des accolades dans des cas aussi simples, 
mais le BLOC peut contenir n'importe quelle expression. En particulier, il peut contenir 
une expression avec des indices. Dans l'exemple suivant, on suppose que $dis- 
patch{$index}} contient une reference a un sous-programme (parfois appele 
« coderef »). L'exemple appelle le sous-programme avec trois arguments. 

&{ $dispatch{$index} }(l, 2, 3); 

Ici le BLOC est indispensable. Sans le couple d'accolades exterieures, Perl aurait traite 
$dispatch comme le coderef a la place de $dispatch{$index}. 

Emploi de I'operateur fleche 

Dans le cas de hachages, de tableaux ou de sous-programmes, une troisieme methode 
de dereferencement implique l'utilisation de I'operateur infixe ->. Cette forme de 
« sucre syntaxique » facilite faeces a un element individuel d'un tableau ou d'un hacha- 
ge, ainsi que l'appel indirect a un sous-programme. 

Le type de dereferencement est determine par l'operande de droite, c'est-a-dire par ce 
qui suit directement la fleche. Si ce qui suit la fleche est un crochet ou une accolade, 
l'operande de gauche est traite respectivement comme une reference a un tableau ou 
un hachage, indexe par l'expression a droite. Si ce qui suit est une parenthese ouvrante, 
l'operande de gauche est traite comme un sous-programme a appeler avec les parame- 
tres fournis entre les parentheses a droite. 

Chacun des trios qui suivent sont equivalents et correspondent aux trois notations que 
nous avons presentees. (Nous avons rajoute des espaces pour que les elements qui se cor- 
respondent soient alignes.) 

$ $reftableau [2] = "Dorian"; #1 
${ $reftableau }[2] = "Dorian"; #2 
$reftableau->[2] = "Dorian"; #3 
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$ $refhash {TON} = "Fa#majeur"; 
${ $refhash }{TON} = "Fattmajeur"; 
$refhash->{TON} = "Fa#majeur"; 



#1 
#2 
#3 



& $refcode (Presto => 192); 
&{ $refcode }(Presto => 192); 
$refcode->(Presto => 192); 



#1 
#2 
#3 



Vous pouvez voir que le premier drole de caractere manque dans la troisieme notation 
de chaque serie. Le drole de caractere est devine par Perl, ce qui fait que cette notation 
ne peut servir pour dereferencer des tableaux ou des hachages entiers, ni meme des 
tranches de ceux-ci. Cependant, tant que vous vous en tenez a des valeurs scalaires, vous 
pouvez utiliser n'importe quelle expression a gauche de ->, y compris un autre derefe- 
rencement, car plusieurs operateurs f leches s'associent de gauche a droite : 

print $tableau[3]->{"Anglais"}->[0]; 

Vous pouvez deduire de cette expression que le quatrieme element de ^tableau est sup- 
pose etre une reference a un hachage, et que la valeur associee a l'entree « Anglais » de 
ce hachage est supposee etre une reference a un tableau. 

Remarquez que $tableau[3] et $tableau->[3] ne sont pas les memes. Le premier don- 
ne le quatrieme element de @tableau, tandis que le second donne le quatrieme element 
du tableau (peut-etre anonyme) dont la reference se trouve dans $tableau. 

Supposez maintenant que $tableau [ 3 ] soit indefini. L'instruction suivante est toujours 
legale : 

$tableau[3]->{"Anglais"}->[0] = "January"; 

C'est Fun des cas que nous avons mentionne precedemment ou les references se mettent 
a exister (ou sont « autovivifiees ») quand on les utilise comme des lvalues (c'est-a-dire 
quand une valeur leur est affectee). Si $tableau[3] etait indefini, il est automatique- 
ment defini comme une reference a un hachage afin que nous puissions affecter une 
valeur a $tableau[3]->{"Anglais"} a l'interieur. Une fois que c'est fait, $tableau[3] - 
>{ "Anglais"} est automatiquement defini comme une reference a un tableau, afin que 
nous puissions affecter une valeur au premier element de ce tableau. Remarquez que 
les rvalues (les valeurs a droite d'une affectation) sont legerement differentes : print 
$tableau[3]->{"Anglais"}->[0] ne cree que $tableau[3] et $tableau[3]->{"Ang- 
lais"}, et pas $tableau[3]->{"Anglais"}->[0], puisque le dernier element n'est pas 
une lvalue. (Le fait que cela definisse les deux premiers dans un contexte de rvalue de- 
vrait etre considere comme une bogue. Nous corrigerons peut-etre cela un jour.) 

La f leche est optionnelle entre les indices delimites par des accolades ou des crochets, et 
entre une accolade ou un crochet fermant et une parenthese destinee a un appel de 
fonction indirect. Vous pouvez done reduire le code precedent a : 

$dispatch{$index}(lj 2, 3); 
$tableau[3]{"Anglais"}[0] = "January"; 

Dans le cas des tableaux ordinaires, cela vous permet d'avoir des tableaux multidimen- 
sionnels exactement comme ceux de C : 

$reponse[$x][$y][$z] += 42; 

Bon d'accord, pas exactement comme ceux de C. D'abord C ne sait pas comment faire 
grossir ses tableaux a la demande, comme Perl. Ensuite certaines constructions similai- 
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res dans les deux langages sont analysees differemment. En Perl, les deux instructions 
suivantes font la meme chose : 

$refliste->[2][2] = "coucou"; # Assez clair 
$$refliste[2][2] = "coucou"; # Prete a confusion 

La seconde instruction peut choquer le programmeur C, qui est habitue a utiliser *a [ i ] 
pour signifier « ce qui est pointe par le i e element de a ». Mais en Perl, les cinq caracte- 
res($ @ * % &)lient plus etroitement que les accolades ou les crochets. 5 C'est done $$re- 
fliste et non $refliste[2] qui est pris comme reference a un tableau. Si vous voulez 
le comportement de C, soit vous devez ecrire ${$refliste[2]} pour forcer 1'evaluation 
de $ref liste[2] avant le premier $dereferenceur, ou bien utiliser la notation -> : 

$refliste[2]->[$salutation] = "coucou"; 

Emploi des methodes d'objets 

Si une reference se trouve etre une reference a un objet, alors la classe qui definit cet 
objet fournit probablement des methodes pour acceder a ce qu'il contient, et vous de- 
vriez generalement vous en tenir a ces methodes si vous ne faites qu'utiliser la classe (par 
opposition a ceux qui l'implementent). En d'autres termes, soyez correct et ne traitez 
pas un objet comme une simple reference, bien que Perl vous laisse faire si vous le devez 
vraiment. Perl n'impose pas l'encapsulation. Nous ne sommes pas des dictateurs. Mais 
nous esperons cependant un peu de civilite de votre part. 

En retour de cette civilite, vous gagnez un complete orthogonalite entre les objets et les 
structures de donnees. Toute structure de donnees peut se comporter comme un objet, 
si vous le voulez. Et ne pas le faire, si vous ne voulez pas. 

Pseudo-hachages 

Un pseudo-hachage est une reference a un tableau dont le premier element est une refe- 
rence a un hachage. Vous pouvez traiter le pseudo-hachage soit comme une reference 
de tableau (comme vous pouviez vous y attendre) ou comme une reference de hachage 
(ce a quoi vous ne vous attendiez peut-etre pas). Voici un exemple de pseudo-hachage : 

$john = [ {age => 1, yeux => 2, poids => 3}, 47, "marron", 84 ]; 

Le hachage sous-jacent dans $john->[0] definit les noms "age", "yeux" et "poids" des 
elements de tableau qui suivent (47, "marron" et 84). Maintenant vous pouvez acceder 
a un element a la fois par la notation de hachage et par celle de tableau : 

$john->{poids} # Traite $john comme une reference de hachage 

$john->[3] # Traite $john comme une reference de tableau 

La magie des pseudo-hachages n'est pas tres puissante ; ils ne connaissent qu'un seul 
« tour » : comment transformer un dereferencement de hachage en dereferencement 
de tableau. Quand vous ajoutez un nouvel element au pseudo-hachage, vous devez ex- 



5. Mais pas a cause de la precedence des operateurs. Les « droles de caracteres » de Perl ne sont 
pas des operateurs dans ce sens-la. La grammaire de Perl interdit simplement a tout ce qui est 
plus complique qu'une simple variable ou un bloc de suivre le drole de caractere initial, pour 
plein de droles de raisons. 
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plicitement preciser au hachage de correspondance sous-jacent oil l'element va resider 
avant d'utiliser la notation de hachage : 

$john->[o]{hauteur} = 4; # hauteur sera l'element 4 

$john->{hauteur} = "grand"; # Ou $john->[4] = "grand" 

Perl leve une exception si vous essayez d'effacer une cle de pseudo-hachage, bien que 
vous puissiez toujours effacer une cle du hachage de correspondance. Perl leve egale- 
ment une exception si vous essayez d'acceder a une cle qui n'existe pas (« existence » si- 
gnifiant ici « presence dans le hachage de correspondance »). 

delete $john->[o]{hauteur}; # Supprime seulement dans le hachage 

# sous-jacent 

$john->{hauteur}; # Ceci leve desormais une exception 

$john->[4]; # Affiche toujours "grand" 

Ne tentez pas de splice du tableau sans savoir ce que vous faites. Si les elements du ta- 
bleau se deplacent, les valeurs de correspondance du hachage feront toujours reference 
aux anciennes positions des elements, a moins que vous ne les changiez elles aussi expli- 
citement. La magie des pseudo-hachages n'est pas tres puissante. 

Pour eviter les incoherences, vous pouvez utiliser la fonction fields: :phash fournie 
par le pragma use fields pour creer un pseudo-hachage : 

use fields; 

$ph = fields: :phash(age => 47, yeux => "marron", poids => 84); 
print $ph->{age}; 

II existe deux manieres de verifier l'existence d'une cle dans un pseudo-hachage. La pre- 
miere est d'utiliser exists, qui verifie si le champ fourni a jamais ete affecte. II fonction- 
ne de cette facon pour reproduire le comportement d'un veritable hachage. Par 
exemple : 

use fields; 

$ph= fields: :phash([qw(age yeux poids)], [47]); 
$ph->{yeux} = undef; 

print exists $ph->{age}; # Vrai, 'age' a ete modifie dans la declaration, 
print exists $ph->{poids}; # Faux, 'poids' n'a pas ete utilise, 
print exists $ph->{yeux}; # Vrai, les 'yeux' ont ete modifies. 

La seconde maniere est d'utiliser exists sur le hachage de correspondance installe dans 
le premier element. Ceci verifie que la cle donnee est un champ valide pour ce pseudo- 
hachage : 

print exists $ph->[o]{age}; # Vrai, 'age' est un champ valide 
print exists $ph->[o]{nom}; # Faux, 'nom' ne peut pas etre utilise 

Contrairement a ce qui se produit pour un veritable hachage, appeler delete sur un ele- 
ment de pseudo-hachage n'efface que la valeur dans le tableau, et pas la cle dans le ha- 
chage de correspondance. Pour effacer la cle, vous devrez l'effacer explicitement du 
hachage de correspondance. Une fois que cela est fait, vous ne pouvez plus utiliser ce 
nom de cle comme indice du pseudo-hachage : 

print delete $ph->{age}; # Detruit $ph->[l], 47 et le renvoie 
print exists $ph->{age}; # Maintenant c'est faux. 
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print exists $ph->[o]{age}; # Vrai, 'age' est encore utilisable 
print delete $ph->[o]{age}; # Maintenant 'age' n'existe plus 
print $ph->{age}; # Exception a l'execution 

Vous commencez surement a vous demander ce qui a pu motiver ce carnaval de ta- 
bleaux se promenant dans un habit de hachage. Les tableaux fournissent un acces plus 
rapide et un stockage plus efficace, tandis que les hachages offrent la possibilite de nom- 
mer (au lieu de numeroter) vos donnees ; les pseudo-hachages offrent le meilleur des 
deux mondes. Mais c'est en considerant la phase de compilation de Perl que vous verrez 
apparaitre le meilleur benefice de l'operation. Avec Faide d'un pragma ou deux, le com- 
pilateur peut verifier faeces correct aux champs valides, aussi pouvez-vous verifier 
Finexistence d'un champ (ou les fautes d'orthographe) avant le debut de votre program- 
me. 

Les proprietes de vitesse, d'efficacite, de verification d'acces a la compilation (vous pou- 
vez mime le voir comme de la validation de type) sont particulierement pratiques pour 
creer des modules de classes robustes et efficaces. Voir la discussion du pragma use 
fields au chapitre 12 et au chapitre 31, Modules de pragmas. 

Les pseudo-hachages sont une fonctionnalite nouvelle et relativement experimentale ; 
en tant que telle, l'implementation en interne est susceptible de changer a l'avenir. Afin 
de vous proteger de tels changements, utilisez toujours Finterface documented du mo- 
dule fields, en utilisant ses fonctions phash et new. 

D'autres tours avec les references en dur 

Comme mentionne precedemment, l'operateur antislash est en general utilise sur un 
seul referent pour generer une reference unique, mais ce n'est pas obligatoire. Quand il 
est utilise sur une liste de referents, il produit une liste de references correspondantes. 
La seconde ligne de l'exemple suivant produit exactement le meme resultat que la pre- 
miere, car l'antislash est automatiquement distribue sur toute la liste. 

(alisteref = (\$s, \@a, \%h, \&f); # Liste de quatre references 
@listeref = \($s, @a %h, &f); # Meme chose 

Si une expression entre parentheses contient exactement un tableau ou un hachage, 
toutes ses valeurs sont interpolees et des references sont renvoyees pour chacune : 

(Slisteref = \(@x); # Interpole le tableau puis prend 

# les references 
@listeref = map { \$_ } @x; # Meme chose 

Cela se produit egalement quand il y a des parentheses a l'interieur : 

|5)listeref = \(@x, (@y) ) ; # Seuls les aggregats simples sont 

# interpoles 

(Slisteref = (\@x, map { \$_ } @y ) ; # Meme chose 

Si vous essayez cela avec un hachage, le resultat contiendra des references aux valeurs 
(comme vous vous y attendez), mais aussi des references a des copies des cles (comme 
vous en vous y attendez peut-etre pas). 

Comme les tranches de tableaux et de hachages sont seulement des listes, vous pouvez 
antislasher des tranches de l'un ou l'autre type pour obtenir une liste de references. Cha- 
cune des trois listes suivantes fait exactement la meme chose : 
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@envrefs = NiSENVf/HOME', 'TERM'}; # Antislashe une tranche 

(Senvrefs = \( $ENV{H0ME}, $ENV{TERM} ); # Antislashe une liste 
@envrefs = ( \$ENV{H0ME}, \$ENV{TERM} ); # Une liste de deux references 

Comme les fonctions peuvent retourner des listes, vous pouvez leur appliquer l'opera- 
teur antislash. Si vous avez plusieurs appels de fonction, interpolez d'abord la valeur de 
retour de chaque fonction dans une liste plus grande avant d'antislasher Fensemble : 

(SUisteref = \fx(); 

@listeref = map { \$_ } fx(); # Meme chose 

glisteref = \( fx(), fy(), fz() ); 

@listeref = ( \fx(), \fy(), \fz() ); # Meme chose 

(ffllisteref = map { \$_ } fx(), fy(), fz(); # Meme chose 

Comme l'operateur antislash fourni un contexte de liste a ses operandes, ces fonctions 
sont toutes appelees en contexte de liste. Si l'antislash est lui-meme en contexte scalaire, 
vous finirez avec une reference a la derniere valeur de la liste renvoyee par la fonction : 

(Slisteref = \localtime(); # Ref a chacun des neuf elements de la date 
$reffinale = \localtime(); # Ref a l'indicateur de l'heure d'ete 

A cet egard, l'operateur antislash se comporte comme les operateurs de liste nommes, 
comme print, reverse et sort, qui fournissent toujours un contexte de liste a leur droi- 
te, quoiqu'il se passe a leur gauche. Comme avec les operateurs de liste nommes, utilisez 
un scalar explicite pour forcer ce qui suit a etre en contexte de liste : 

$refdate = \scalar localtimeQ; # \"Thu Dul 26 11:37:38 2001" 

Vous pouvez vous servir de l'operateur ref pour determiner vers quoi une reference 
pointe. Vous pouvez voir l'operateur ref comme un operateur « typeof » qui renvoie 
vrai si son argument est une reference et faux dans le cas contraire. La valeur renvoyee 
depend du type de chose referencee. Les types predefinis comprennent SCALAR, ARRAY, 
HASH, CODE, GLOB, REF, LVALUE, 10, 10: :Handle et Regexp. Ici, nous nous en servons pour 
valider les arguments d'un sous-programme : 

sub somme { 

my $reftableau = shift; 

warn "Ce n'est pas une reference de tableau" 

if ref ($ref tableau) ne "ARRAY"; 
return eval join("+", @$ref tableau); 

} 

Si vous utilisez une reference en dur dans un contexte de chaine, elle sera convertie en 
une chaine contenant le type et l'adresse : SCALAR(OxlfcOe). (La conversion inverse ne 
peut pas etre faite, puisque Finformation de decompte de references est perdue pendant 
l'operation de conversion en chaine — et aussi car il serait dangereux de laisser des pro- 
grammes acceder a une adresse memoire donnee par une chaine arbitraire.) 

Vous pouvez utiliser l'operateur bless pour associer un referent a un paquetage fonc- 
tionnant comme une classe d'objet. Quand vous faites cela, ref renvoie le nom de la 
classe au lieu du type interne. Une reference d'objet utilisee en contexte de chaine ren- 
voie une chaine avec les types interne et externe, ainsi que l'adresse en memoire : Mon- 
Type=HASH(0x20dl0) ou 10: :Handle=I0(0xl86904). Pour plus de details sur les objets, 
voir le chapitre 12. 
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Puisque le type de referent que vous desirez est indique par la facon dont vous le dere- 
ferencez, un typeglob peut etre utilise de la meme facon qu'une reference, malgre le fait 
qu'un referent contienne plusieurs referents de types divers. ${*main: :toto} et 
${\$main: :toto} accedent done tous deux a la meme variable scalaire, meme si le se- 
cond est plus efficace. 

Voici une astuce pour interpoler la valeur de retour d'un appel de fonction dans une 
chaine : 

print "Ma fonction a renvoye @{[ mafonction(l,2,3) ]} cette fois.Nn"; 

Voici comment cela fonctionne. A la compilation, quand le @{ . . . } est vu a l'interieur 
de la chame entre guillemets doubles, il est analyse comme un bloc qui renvoie une re- 
ference. A l'interieur du bloc, les crochets creent une reference a un tableau anonyme 
a partir de ce qui se trouve entre eux. A l'execution, mafonction(l,2,3) est done appe- 
lee en contexte de liste, et les resultats sont charges dans un tableau anonyme dont une 
reference est renvoyee a l'interieur du bloc. Cette reference de tableau est immediate- 
ment dereferencee par le @{ . . . } qui l'entoure, et la valeur de tableau est interpolee 
dans la chaine a doubles guillemets tout comme un tableau ordinaire le serait. Ce stra- 
tageme s'avere egalement utile pour des expressions quelconques, comme : 

print "II nous faut @{ [$n + 5] } machins !\n"; 

Cependant faites attention : les crochets fournissent un contexte de liste a leur expres- 
sion. Dans ce cas, cela n'a aucune importance, mais l'appel precedent a mafonction 
aurait pu y etre sensible. Quand il le faut, utilisez un scalar explicite pour forcer le con- 
texte : 

print "mafonction renvoie @{ [scalar mafonction(l,2,3)] } maintenant An"; 

Fermetures 

Nous avons parle plus haut de la creation de sous-programmes anonymes avec un 
sub {} sans nom. Vous pouvez voir ces sous-programmes comme s'ils etaient definis a 
l'execution, ce qui signifie qu'ils ont un instant de generation en plus d'une position de 
definition. Certaines variables pourraient etre a portee quand le sous-programme est 
cree, et d'autres variables pourraient etre a portee quand le sous-programme est appele. 

Oubliez les sous-programmes pour le moment et considerez une reference qui se refere 
a une variable lexicale : 

{ 

my $bestiau = "chameau"; 
$refbestiau = \$creature; 

} 

La valeur de $$ref bestiau restera « chameau » bien que $bestiau disparaisse apres l'ac- 
colade fermante. Mais $refbestiau aurait tres bien pu faire reference a un sous-pro- 
gramme qui se refere a $bestiau : 

{ 

my $bestiau = "chameau"; 

$refbestiau = sub { return $bestiau }; 

} 
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C'est une fermeture, qui est une notion sortie du monde de la programmation fonction- 
nelle de LISP et Scheme. 6 Cela signifie que quand vous definissez un sous-programme 
anonyme dans une portee lexicale particuliere a un moment donne, il pretend conti- 
nuer a fonctionner dans cette portee particuliere, meme si vous l'appelez plus tard de- 
puis l'exterieur de cette portee. (Un puriste dirait qu'il n'a pas besoin de pretendre — il 
fonctionne reellement dans cette portee.) 

En d'autres termes, vous etes assure de garder la meme copie d'une variable lexicale a 
chaque fois, meme si d'autres instances de cette variable lexicale ont ete creees avant ou 
apres pour d'autres instances de cette fermeture. Cela vous permet de d'ajuster les va- 
leurs utilisees par un sous-programme quand vous le definissez, et pas seulement quand 
vous l'appelez. 

Vous pouvez aussi voir les fermetures comme une maniere d'ecrire un patron de sous- 
programme sans utiliser eval. Les variables lexicales servent de parametres pour rem- 
plir le modele, ce qui est utile pour configurer des petits bouts de code a executer plus 
tard. On les appelle communement des fonctions de rappel en programmation evene- 
mentielle, quand vous associez un bout de code a la pression d'une touche, a un clic de 
souris, a l'exposition d'une fenetre et ainsi de suite. Quand on les utilise comme des 
fonctions de rappel, les fermetures font exactement ce a quoi vous vous attendez, meme 
si vous ne connaissez rien a la programmation fonctionnelle. (Remarquez que cette his- 
toire de fermeture ne s'applique qu'aux variables my. Les variables globales fonctionnent 
comme elles ont toujours fonctionne, etant creees et detruites de facon completement 
differente des variables lexicales. 

Une autre utilisation des fermetures se fait a l'interieur de generateurs de fonctions ; c'est- 
a-dire de fonctions qui creent et retournent de nouvelles fonctions. Voici un exemple de 
generateur de fonction implemente avec des fermetures : 

sub faitbonjour { 
my $salut = shift; 
my $newfunc = sub { 

my $cible = shift; 

print "$salut, $cible !\n"; 

}; 

return $newfunc; # Renvoie une fermeture 

} 

$f = faitbonjour("Bonjour"); # Cree une fermeture 

$g = faitbonjour("Salutations"); # Cree une autre fermeture 

# Le temps passe. . . 

$f->("monde"); 
$g->("Terriens"); 

Cela affiche : 

Bonjour, monde ! 
Salutations, Terriens ! 



6. Dans ce contexte, « fonctionnel » ne doit pas etre interprets comme le contraire de 
« dysfonctionnel ». 
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Remarquez en particulier comme $salut continue de faire reference a la valeur effecti- 
vement passee a f aitbonjour, malgre le fait que le my $salut soit hors de portee quand 
le sous-programme anonyme tourne. C'est tout l'interet des fermetures. Comme $f et 
$g contiennent des references a des fonctions qui, quand on les appelle, ont toujours be- 
soin d'acceder a des versions distinctes de $salut, ces versions restent automatiquement 
dans les environs. Si maintenant vous effacez $f, sa version de $salut disparaitra auto- 
matiquement. (Perl nettoie quand vous avez le dos tourne.) 

Perl ne fournit pas de references aux methodes d'objets (decrites au chapitre 12) mais 
vous pouvez obtenir un effet similaire en utilisant une fermeture. Supposons que vous 
voulez une reference, pas seulement a la fonction que la methode represente, mais aussi 
une reference qui, quand vous l'invoquez, appelle cette methode sur un objet particu- 
lier. Vous pouvez commodement vous souvenir a la fois de l'objet et de la methode en 
en faisant des variables lexicales liees a une fermeture : 

sub get_ref_methode { 

my ($self, $nommethode) = (5)_; 
my $refmeth = sub { 

# le @_ ci-dessous est different de celui au-dessus ! 

return $self->$nommethode(@_); 

}; 

return $refmeth; 

} 

my $toutou = new Chien:: 

Nom => "Lucky", 

Pattes => 3, 

Queue => "coupee"; 

our $remueur = get_ref_methode($toutou, 'remuer'); 
$remueur->("queue"); # Appelle Sdog^remuerCqueue' ) . 

Vous pouvez done demander a Lucky de remuer ce qui lui reste de queue meme quand 
la variable lexicale $toutou est hors de portee et que Lucky n'est plus visible. La variable 
globale $remueur peut toujours lui faire remuer la queue, oil qu'il se trouve. 

Fermetures comme modeles de fonctions 

Utiliser une fermeture comme modele de fonctions vous permet de generer plusieurs 
fonctions qui agissent de facon similaire. Supposons que vous voulez une suite de fonc- 
tions qui generent des changements de fonte HTML pour diverses couleurs : 

print "Soyez ", rouge("prudent"), "avec cette ", vert("lumiere"), " !!!"; 

Les fonctions rouge et vert seraient tres similaires. Nous aimerions bien nommer nos 
fonctions, mais les fermetures n'ont pas de nom puisqu'il s'agit juste de routines qui s'y 
croient. Pour contourner cela, nous allons utiliser une jolie astuce pour nommer nos 
sous-programmes anonymes. Vous pouvez lier une reference de code a un nom existant 
en l'affectant au typeglob du nom de la fonction que vous voulez. (Voir la section Tables 
de symboles au chapitre 10, Paquetages). Dans ce cas, nous allons la lier a deux noms dif- 
ferents, l'un en majuscules et l'autres en minuscules : 

(Scouleurs = qw(red blue green yellow orange purple violet); 
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for my $nom (@couleurs) { 

no strict 'iefs'; # Autorise les references symboliques 

*$nom = *{uc $nom} = sub { "<F0NT C0L0R= , $nom , >;|5)_</F0NT>" }; 

} 

Vous pouvez maintenant appeler les fonctions nominees red, RED, blue, BLUE et ainsi de 
suite, et la fermeture appropriee sera invoquee. Cette technique reduit la duree de com- 
pilation et conserve la memoire ; elle est aussi moins susceptible d'erreur, puisque la ve- 
rification de syntaxe se fait a la compilation. II est imperatif que les variables dans le 
sous-programme anonyme soient lexicales afin de creer une fermeture. C'est la raison 
du my dans l'exemple ci-dessus. 

Voici l'un des rares cas oil donner un prototype a une fermeture sert a quelque chose. 
Si vous aviez voulu imposer un contexte scalaire aux arguments de ces fonctions (ce n'est 
probablement pas une bonne idee pour cet exemple), vous auriez plutot ecrit ceci : 

*$nom = sub ($) { "<F0NT C0L0R='$nom'>$_[0]</F0NT>" }; 

C'est presque suffisant. Cependant comme la verification de prototypes se produit a la 
compilation, Faffectation a l'execution se produit trop tard pour servir a quelque chose. 
Vous pouvez corriger cela en mettant toute la boucle d'affectations dans un bloc BEGIN 
qui la forcera a se produire a la compilation. (Plus probalement, vous la mettriez dans 
un module sur lequel vous ferez un use a la compilation.) Les prototypes seront alors 
visibles pour le reste de la compilation. 

Sous-programmes embottes 

Si vous avez l'habitude (prise dans d'autres langages de programmation) d'utiliser des 
procedures emboitees dans d'autres procedures, chacune avec ses propres variables pri- 
vees, il va vous falloir travailler un peu en Perl. Les sous-programmes nommes ne s'em- 
boitent pas bien, alors que les sous-programmes anonymes le peuvent. 7 De toute facon, 
nous pouvons emuler des sous-programmes emboites a portee lexicale a l'aide de fer- 
metures. En voici un exemple : 

sub exterieur { 

my $x = $_[0] + 35; 

local *interieur = sub { return $x * 19 }; 
return $x + interieurQ; 

} 

Maintenant interieur ne peut etre appele que depuis exterieur a cause de l'affectation 
temporaire de la fermeture. Mais quand il Test, il a acces normalement a la variable lexi- 
cale $x depuis la portee de exterieur. 

Ceci a l'interessant effet de creer une fonction locale a une autre, ce qui est quelque cho- 
se qui n'est normalement pas supporte en Perl. Comme local est a portee dynamique, 
et parce que les noms de fonctions sont globaux a leur paquetage, toute autre fonction 
qui serait appelee par exterieur pourrait aussi appeler la version temporaire 



7. Pour etre plus precis, les sous-programmes ayant un nom global ne s'emboitent pas. Malheu- 
reusement c'est le seul type de declaration de sous-programmes nommes que nous ayons. Nous 
n'avons pas encore implements les sous-programmes nommes a portee lexicale (connus sous le 
nom de my sub), mais quand nous le ferons, ils s'emboiteront correctement. 
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d'interieur. Pour empecher cela, il vous faudra un niveau supplemental d'indirec- 
tion : 

sub exterieur { 

my $x = $_[0] + 35; 

my $interieur = sub { return $x * 19 }; 
return $x + $interieur->(); 



References symboliques 



Que se passe-t-il si vous essayez de dereferencer une valeur qui n'est pas une reference 
en dur ? La valeur est alors traitee comme une reference symbolique. C'est-a-dire que la 
reference est interpreted comme une chaine representant le nom d'une variable globale. 

Voici comment cela fonctionne : 

$nom = "bam"; 

$$nom =1; # Definit $bam 

$nom->[0] =4; # Definit le premier element de @bam 

$nom->{X} = "Y"; # Definit V element X de %bam a Y 

|S$nom =(); # Vide @bam 

keys %$nom; # Renvoie les cles de %bam 

&$nom; # Appelle &bam 

C'est tres puissant et legerement dangereux, en ce qu'il est possible de vouloir (avec la 
plus grande sincerite) utiliser une reference en dur, mais d'accidentellement utiliser une 
reference symbolique a la place. Pour vous proteger contre cela, vous pouvez ecrire : 

use strict J refs J ; 

et seules les references en dur seront autorisees dans le reste du bloc englobant. Un bloc 
interieur peut suspendre cette restriction par : 

no strict 'rets'; 

Il est aussi important de comprendre la difference entre les deux lignes de code suivan- 
tes : 

${identificateur}; # Comme $identificateur. 
${"identificateur"}; # $identif icateur aussi, mais une reference 
symbolique. 

Parce que la seconde forme est entre guillemets, elle est traitee comme une reference 
symbolique, et generera une erreur avec use strict 'refs\ Meme si use strict 
' ref s ' n'est pas active, elle peut seulement faire reference a une variable de paquetage. 
Mais la premiere forme est identique a la forme sans accolades, et fera meme reference 
a une variable a portee lexicale s'il y en a de declaree. L'exemple suivant le montre (et 
la section suivante en parle). 

Seules les variables de paquetage sont accessibles par des references symboliques, car les 
references symboliques passent toujours par la table de symboles du paquetage. Comme 
les variables lexicales ne se trouvent pas la table de symboles, elles sont invisibles pour 
ce mecanisme. Par exemple : 

our $valeur = "globale"; 



242 



Chapitre 8 — References 



{ 

my $valeur = "privee"; 

print "A l'interieur, my est ${valeur}, "; 

print "mais our est ${'valeur'}.\n"; 

} 

print "A l'exterieur, ${valeur} est de nouveau ${'valeur'}.\n"; 

ce qui affiche : 

A l'interieur, my est privee, mais our est globale. 
A l'exterieur, globale est de nouveau globale. 

Accolades, crochets et guillemets 

Dans la section precedente nous avons vu que ${identif icateur} n'est pas traite com- 
me une reference symbolique. Vous vous demandez surement comment cela peut inte- 
ragir avec les mots reserves. La reponse est que cela n'interagit pas. Bien que push soit 
un mot reserve, ces deux instructions affichent « pop par dessus » : 

$push = "pop par "; 
print "${push}dessus"; 

La raison en est qu'historiquement, cette utilisation des accolades est celle des shells 
Unix pour isoler un nom de variable du texte alphanumerique qui le suit, et qui aurait 
sinon ete interprete comme faisant partie du nom. C'est la facon dont beaucoup de gens 
s'attendent a voir fonctionner Finterpolation, aussi l'avons nous fait fonctionner de la 
meme facon en Perl. Mais en Perl cette notion s'etend plus loin, et s'applique egalement 
aux accolades utilisees pour generer les references, qu'elles soient ou non entre guille- 
mets. Cela signifie que : 

print ${push} . 'dessus'; 

ou meme (puisque les blancs ne changent rien) : 

print ${ push } . 'dessus'; 

affichent tous deux « pop par dessus », meme si les accolades sont en dehors des guille- 
mets doubles. La meme regie s'applique a tout identificateur utilise pour indexer un ha- 
chage. Ainsi, au lieu d'ecrire : 

$hash{ "aaa" }{ "bbb" }{ "ccc" } 
vous pouvez simplement ecrire : 

$hash{ aaa }{ bbb }{ ccc } 
ou : 

$hash{aaa}{bbb}{ccc} 
sans vous soucier de savoir si les indices sont des mots reserves. Done ceci : 
$hash{ shift } 

est interprete comme $hash{"shift"}. Vous pouvez forcer l'interpretation comme un 
mot reserve en ajoutant quelque chose qui le differencie d'un identificateur : 

$hash{ shiftQ } 
$hash{ +shift } 
$hash{ shift @_ } 
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Les references nefonctionnent pas comme cles de 
hachages 

Les cles de hachage sont stockees en interne comme des chaines. 8 Si vous essayez de stac- 
ker une reference dans un hachage, la valeur de la cle sera convertie en chaine : 

$x{ \$a } = $a; 

($cle, $valeur) = each %x; 

print $$cle; # FAUX 

Nous avons mentionne plus tot que vous ne pouvez pas reconvertir une chaine en refe- 
rence en dur. Si vous essayez de dereferencer $cle qui contient une simple chaine, vous 
ne recupererez pas une reference en dur, mais simplement un dereferencement symbo- 
lique. Et comme vous n'avez pas de variable nommee SCALAR(OxlfcOe), vous n'obtien- 
drez pas ce que vous voulez. Vous devriez plutot essayer quelque chose comme ceci : 

$r = \@a; 

$x{ $r } = $r; 

Comme cela vous pourrez au moins utiliser la valeur du hachage, qui sera une reference 
en dur, au lieu de la cle qui n'en est pas une. 

Bien que vous ne puissiez pas stacker une reference en tant que cle, si vous utilisez une 
reference en dur dans un contexte de chaine (comme dans Fexemple precedent), vous 
etes certain que cela produira une chaine unique, puisque l'adresse de la reference fait 
partie de la chaine retournee. Vous pouvez done utiliser une reference comme cle d'un 
hachage. Seulement vous ne pourrez pas la dereferencer par la suite. 

II existe un cas particulier de hachage dans lequel vous pouvez utiliser des references 
comme cles. Par la magie 9 du module Tie : : Ref Hash fourni avec Perl, vous pouvez faire 
ce que nous venons juste de dire que vous ne pouviez pas faire : 

use Tie: :RefHash; 

tie my %h, 'Tie: : Ref Hash'; 

%h = ( 

["ceci", "ici"] => "a la maison", 
["cela", "la-bas"] => "ailleurs", 

); 

while ( my($refcle, $valeur) = each %h ) { 
print "@$refcle is $valeur\n"; 

} 

En fait, en liant des implementations differentes aux types predefinis, vous pouvez faire 
se comporter des scalaires, des hachages et des tableaux de beaucoup de manieres dont 
nous vous avions dit que e'etait impossible. Ca nous apprendra, imbeciles d'auteurs... 

Pour en savoir plus sur les liens avec tie, voir le chapitre 14, Variables liees. 



8. Elles sont egalement stockees en externe comme des chaines, par exemple quand vous les stoc- 
kez dans des fichiers DBM. En fait, les fichiers DBM imposent que leurs cles (et valeurs) soient des 
chaines. 

9. Oui, e'est un terme technique, comme vous vous en rendrez compte si vous fouillez un peu 
dans le fichier mg.c dans les sources de Perl. 
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Ramasse-miettes, references circulaires et references 
faibles 

Les langages de haut niveau permettent aux programmeurs de ne pas s'inquieter de la 
liberation de la memoire quand ils ont fini de l'utiliser. Ce precede de recuperation 
automatique de la memoire s'appelle en francais le ramassage des miettes (en anglais gar- 
bage collecting ou collecte des ordures). Dans la plupart des cas, Perl se sert d'un meca- 
nisme simple et rapide de ramasse miettes fonde sur le comptage de references. 

Quand on sort d'un bloc, ses variables a portee locale sont normalement liberees, mais 
il est possible de cacher vos miettes de facon a ce que le ramasse miettes de Perl ne puisse 
les trouver. Un probleme serieux est que de la memoire inatteignable avec un decompte 
de references non nul ne sera normalement pas liberee. C'est pourquoi les references 
circulaires sont une mauvaise idee : 

{ # fait pointer $a et $b l'un sur l'autre 

my ($a, $b); 
$a = \$b; 
$b = \$a; 

} 

ou plus simplement : 

{ # fait pointer $a sur lui-meme 

my $a; 
$a = \$a; 

} 

Bien que $a doive etre desalloue a la fin du bloc, en fait il ne Test pas. Quand vous cons- 
truisez des structures de donnees recursives, il vous faudra casser (ou affaiblir, voir plus 
loin) l'autoreference vous-meme si vous voulez que la memoire soit recuperee avant la 
fin de votre programme (ou de votre thread). (A la sortie, la memoire sera automatique- 
ment recuperee pour vous par un mecanisme couteux mais complet de ramasse-miettes 
par marquage et balayage.) Si la structure de donnees est un objet, vous pouvez utiliser 
la methode DESTROY pour casser automatiquement la reference ; voir Ramasse-miettes 
avec les methodes DESTROY m chapitre 12. 

Une situation similaire peut se produire avec les caches — des entrepots de donnees con- 
cus pour une recuperation plus rapide que la normale. Hors du cache on trouve des re- 
ferences a donnees a l'interieur du cache. Le probleme se produit quand toutes ces 
references sont effacees, mais que les donnees du cache et les references internes restent. 
L'existence d'une reference empeche Perl de recuperer le referent, meme si nous vou- 
lons que les donnees du cache disparaissent des qu'elles ne sont plus utiles. Comme pour 
les references circulaires, nous vous une reference qui n'affecte pas le compte de referen- 
ces, et done ne retarde pas le ramasse-miettes. 

Les references faibles resolvent les problemes causes par les references circulaires en vous 
permettant d'« affaiblir » n'importe quelle reference ; e'est-a-dire lui permettre de ne pas 
modifier le compte des references. Quand la derniere reference non faible a un objet est 
detruite, l'objet est detruit et toutes les references faibles sont automatiquement liberees. 

Pour utiliser cette fonctionnalite, vous aurez besoin du module WeakRef disponible sur 
CPAN qui contient une documentation complementaire. Les references faibles sont 
une fonctionnalite experimentale. Mais il faut bien que quelqu'un serve de cobaye. 



9 

Structures de donnees 



Perl fournit gratuitement beaucoup des structures de donnees que vous devez construi- 
re vous-meme dans d'autres langages de programmation. Les piles et et les files que les 
informaticiens en herbe apprennent en cours ne sont que des tableaux en Perl. Quand 
vous faites push et pop (ou shift et unshift) sur un tableau, c'est une pile ; quand vous 
faites push et shift (ou unshift et pop) sur un tableau, c'est une file. Beaucoup de struc- 
tures arborescentes dans le monde sont construites pour fournir un acces rapide et dy- 
namique a une table de consultation conceptuellement plate. Bien sur, les hachages 
font partie de Perl et ils fournissent un acces rapide et dynamique a une table de con- 
sultation conceptuellement plate. Tout cela sans les abrutissantes structures de donnees 
que trouvent magnifiques ceux dont les esprits ont deja ete convenablement abrutis. 

Mais parfois vous avez besoin de structures de donnees imbriquees parce qu'elle mode- 
lisent naturellement le probleme que vous essayez de resoudre. Perl vous permet alors 
de combiner et d'emboiter des tableaux et des hachages de maniere a creer des structu- 
res de donnees aussi complexes que vous voulez. Quand ils sont utilises correctement, 
ils peuvent servir a creer des listes chainees, des arbres binaires, des tas, des arbres-B, des 
ensembles, des graphes et tout ce que vous pouvez imaginer d'autre. Voir Mastering Al- 
gorithms with Perl (O'Reilly, 1999), Perl en action (O'Reilly, France, 1999) 1 , ou CPAN qui 
sert de depot central pour tout ce genre de modules. Mais vous n'aurez peut-etre jamais 
besoin que de simples combinaisons de tableaux et de hachages, aussi est-ce ce dont 
nous allons parler dans ce chapitre. 

Tableaux de tableaux 

II existe de nombreuses sortes de structures de donnees. La plus simple a construire est 
le tableau de tableaux, aussi appele matrice a deux dimensions. (Ceci se generalise de 
maniere evidente : un tableau de tableaux de tableaux est une matrice a trois dimen- 
sions, et ainsi de suite pour les dimensions superieures.) C'est relativement simple a 



1. Perl Cookbook (O'Reilly, 1998) pour la version originale. 
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comprendre, et presque tout ce qui s'applique dans ce cas s'appliquera aussi aux structu- 
res plus compliquees que nous explorerons dans les sections suivantes. 

Creation et acces a un tableau a deux dimensions 

Voici comment construire un tableau a deux dimensions : 

# Affecte une liste de references de tableaux a un tableau 
@TdT = ( 

[ "fred", "barney" ], 

[ "george", "jane", "elroy" ], 

[ "homer", "marge", "bart" ], 

); 

print $TdT[2][l]; # affiche "marge" 

La liste complete est entouree par des parentheses et non par des crochets car vous faites 
une affectation a une liste et non a une reference. Si vous preferiez une reference, vous 
utiliseriez des crochets : 

# Cree une reference a un tableau de references. 
$ref_a_TdT = [ 

[ "fred", "barney", "pebbles", "bamm bamm", "dino", ], 

[ "homer", "bart", "marge", "maggie", ], 

[ "george", "jane", "elroy", "judy", ], 

]; 

print $ref_a_TdT->[2] [3]; # affiche "judy" 

Rappelez-vous qu'il y a un -> implicite entre deux accolades ou crochets adjacents. Ces 
deux lignes : 

$TdT[2][3] 
$ref_a_TdT->[2][3] 

sont done equivalentes aux deux lignes suivantes : 

$TdT[2]->[3] 
$ref_a_TdT->[2]->[3] 

II n'y a cependant aucun - > implicite avant la premiere paire de crochets, e'est pourquoi 
le dereferencement de $ref _a_TdT necessite le - > initial. N'oubliez pas que vous pouvez 
aussi compter a partir de la fin d'un tableau avec un indice negatif, done : 

$TdT[0][-2] 

est l'avant-dernier element de la premiere ligne. 

Volez de vos propres ailes 

Ces grosses affectations de listes sont belles et bonnes pour creer une structure de don- 
nees fixe, mais comment faire si vous voulez construire chaque element au vol ou cons- 
truire la structure au coup par coup ? 

Lisons une structure de donnees a partir d'un fichier. Nous supposerons qu'il s'agit d'un 
fichier texte, oil chaque ligne est une rangee de la structure et est composee d'elements 
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separes par des blancs. Voici comment proceder : 2 
while (<>) { 

@tmp = split; # Splite les elements dans un tableau 

push @TdTj [ @tmp ]; # Ajoute une reference de tableau anonyme a @TdT 

} 

Bien sur, vous n'avez pas besoin de dormer un nom au tableau temporaire et vous pour- 
riez done aussi ecrire : 

while (<>) { 

push @TdT, [ split ]; 

} 

Si vous voulez une reference a un tableau de tableaux, vous pouvez proceder ainsi : 

while (<>) { 

push @$ref_a_TdT, [ split ]; 

} 

Ces deux exemples ajoutent de nouvelles lignes au tableau de tableaux. Comment faire 
pour ajouter de nouvelles colonnes ? Si vous ne travaillez qu'avec des tableaux a deux 
dimensions, il est souvent plus facile d'utiliser une affectation simple : 3 

for $x (0 .. 9) { # Pour chaque ligne... 

for $y (0 . . 9) { # Pour chaque colonne... 

$TdT[$x][$y] = func($x, $y); # ...affecte cette valeur 

} 

} 

for $x ( 0..9 ) { # Pour chaque ligne... 

$ref_a_TdT->[$x] [3] = func2($x); # ...affecte la quatrieme colonne 

} 

L'ordre dans lequel vous affectez les elements n'a pas d'importance, pas plus que le fait 
que les elements indices de @TdT existent deja ou non ; Perl les creera pour vous si be- 
soin est en mettant les elements intermediaries a la valeur indefinie. (Perl creera meme 
la reference initiale dans $ref_a_TdT pour vous s'il le faut.) Si vous voulez juste ajouter 
des elements au bout d'une ligne, vous devrez faire quelque chose d'un peu plus 
etrange : 

# Ajoute de nouvelles colonnes a une ligne existante. 
push @{ $TdT[0] }, "wilma", "betty"; 

Remarquez que ceci ne marcherait pas : 

push $TdT[0], "wilma", "betty"; # FAUX ! 

Cela ne compilerait meme pas, car l'argument de push doit etre un veritable tableau, et 
pas seulement une reference a un tableau. C'est pourquoi le premier argument doit ab- 
solument commencer par un caractere @. Ce qui suit le @ est assez negotiable. 



2. Ici comme dans d'autres chapitres, nous omettons (pour la clarte des exemples) les declara- 
tions my que vous devriez normalement mettre. Dans cet exemple, vous devriez ecrire my (5>tmp = 
split. 

3. Comme avec l'affectation temporaire precedente, nous avons simplifie ; les boucles de ce cha- 
pitre seraient tres probablement ecrites for my $x dans du code reel. 
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Utilisation et affichage 

Affichons maintenant la structure de donnees. Si vous ne voulez qu'un seul element, 
ceci suffit : 

print $TdT[3][2]; 

Mais si vous voulez tout imprimer, vous ne pouvez pas vous contenter d'ecrire : 

print @TdT; # FAUX 

C'est incorrect car vous aurez des references sous forme de chames de caracteres au lieu 
de vos donnees. Perl ne dereference jamais automatiquement a votre place. II vous faut 
done construire une boucle ou deux. Le code qui suit affiche la structure complete, en 
bouclant sur les elements de @TdT et en les dereferencant chacun a Pinterieur de Fins- 
truction print : 

for $ligne ( @TdT ) { 
print "@$ligne\n"; 

} 

Pour garder la trace des indices, vous pouvez faire comme ceci : 

for $i ( 0 .. $#TdT ) { 

print "La ligne $i est : @{$TdT[$i]}\n"; 

} 

ou meme cela (remarquez la boucle interieure) : 

for $i ( 0 .. $#TdT ) { 

for $j ( 0 .. $#{$TdT[$i]} ) { 

print 'V element $i $j est $AoA[$i] [$j]\n"; 

} 

} 

Comme vous pouvez le voir, les choses se compliquent. C'est pourquoi il est parfois plus 
simple d'utiliser une variable temporaire en cours de route : 

for $i ( 0 .. $#TdT ) { 
$ligne = $TdT[$i]; 
for $j ( 0 .. $#{$ligne} ) { 

print "L'element $i $j est $ligne->[$j]\n"; 

} 

} 

Tranches 

Si vous voulez acceder a une tranche (une partie de ligne) d'un tableau multidimen- 
sionnel, vous allez devoir faire des indexations subtiles. L'operateur f leche nous donne 
une facon simple d'acceder a un element unique, mais rien de tel n'existe pour les tran- 
ches. Vous pouvez toujours extraire les elements de votre tranche un par un avec une 
boucle : 

(Spartie = (); 

for ($y = 7; $y < 13; $y++) { 

push (jDpartie, $TdT[4][$y]j 

} 
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Cette boucle particuliere pourrait etre remplacee par une tranche de tableau : 

(Spartie = @{ $TdT[4] } [ 7.. 12 ]; 

Si vous voulez une tranche a deux dimensions, par exemple, avec $x dans l'intervalle 
4. .8 et $y dans 7. .12, voici une maniere de proceder : 

(SinouveauTdT = (); 

for ($startx = $x = 4; $x <= 8; $x++) { 

for ($starty = $y = 7; $y <= 12; $y++) { 

$nouveauTdT[$x - $startx][$y - $starty] = $TdT[$x][$y]; 

} 

} 

Dans cet exemple, les valeurs individuelles dans notre tableau d'arrivee a deux dimen- 
sions, @nouveauTdT, sont affectees une par une a partir d'un sous-tableau a deux dimen- 
sions de @TdT. Une autre possibility consiste a creer des tableaux anonymes, chacun 
d'entre eux etant constitue de la tranche desiree d'un sous-tableau de @TdT, puis a mettre 
des references a ces tableaux anonymes dans (SnouveauTdT. Nous pourrions alors stocker 
les references dans @nouveauTdT (indexe une seule fois, pour ainsi dire) au lieu de stoc- 
ker des valeurs de sous-tableau dans un @nouveauTdT indexe deux fois. Cette methode 
elimine la boucle interieure : 

for ($x = 4; $x <= 8; $x++) { 

push (SnouveauTdT, [ @{ $TdT[$x] } [ 7.. 12 ] ]; 

} 

Bien sur, si vous faites cela souvent, vous devriez probablement ecrire un sous-program- 
me appele par exemple extraire_rectangle. Et si vous faites cela tres souvent avec de 
grandes series de donnees multidimensionnelles, vous devriez probablement utiliser le 
module PDL (Perl Data Language), disponible sur CPAN. 

Erreursfrequentes 

Comme nous l'avons deja mentionne, les tableaux et les hachages de Perl sont a une di- 
mension. En Perl, meme les tableaux « multidimensionnels » sont en fait a une dimen- 
sion, mais les valeurs le long de cette dimension sont des references a d'autres tableaux, 
qui agregent plusieurs elements en un seul. Si vous affichez ces valeurs sans les derefe- 
rencer, vous obtiendrez les references converties en chaines en lieu et place des donnees 
desirees. Par exemple ces deux lignes : 

@TdT = ( [2, 3], [4, 5, 7], [0] ); 
print "@TdT"; 

donneront quelque chose comme : 

ARRAY(Ox83c38) ARRAY(0x8bl94) ARRAY(0x8bldu) 
D'un autre cote, cette ligne affiche 7 : 

print $TdT[l][2]; 

Quand vous construisez un tableau de tableaux, n'oubliez pas de creer de nouvelles re- 
ferences pour les sous-tableaux. Sinon, vous vous contenterez de creer un tableau con- 
tenant le nombre d'elements des sous-tableaux, comme ceci : 
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for $i (l. .10) { 

(Sitableau = fonction($i); 

$TdT[$i] = (Sitableau; # FAUX ! 

} 

Ici on accede a (Sitableau en contexte scalaire, ce qui renvoie done le nombre de ses ele- 
ments, lequel est affecte comme il se doit a $TdT[$i]. La maniere correcte d'affecter la 
reference vous sera montree dans un moment. 

Apres avoir fait l'erreur precedente, les gens realisent qu'ils doivent affecter une referen- 
ce. L'erreur qu'ils font naturellement ensuite implique de prendre et reprendre une re- 
ference vers toujours le meme emplacement memoire : 

for $i (l. .10) { 

(Sitableau = fonction($i); 

$TdT[$i] = \@tableau; # ENCORE FAUX ! 

} 

Chaque reference generee par la seconde ligne de la boucle for est la meme, c'est-a-dire 
une reference au seul tableau ^tableau. Certes, ce tableau change effectivement a cha- 
que passage dans la boucle, mais quand tout est fini, $TdT contient 10 references au 
meme tableau, qui contient maintenant la derniere serie de valeurs qui lui ont ete af- 
fectees. print @{$TdT[l]} presentera les memes valeurs que print @{$TdT[2]}. 

Voici une approche qui aura plus de succes : 

for $i (l. .10) { 

^tableau = fonction($i); 

$TdT[$i] = [ (Sitableau ]; # CORRECT ! 

} 

Les crochets autour de ^tableau creent un nouveau tableau anonyme, dans lequel les 
elements de ^tableau sont copies. Nous stockons ensuite une reference a ce nouveau 
tableau. 

Un resultat similaire, bien que beaucoup plus difficile a lire, pourra etre obtenu par : 

for $i (1. .10) { 

(Sitableau = fonction($i); 
@{$TdT[$i]} = (Sitableau; 

} 

Comme $TdT [ $i ] doit etre une nouvelle reference, la reference se met a exister. Le @ qui 
precede dereference alors cette nouvelle reference, avec pour resultat d'affecter (en con- 
texte de liste) les valeurs de ^tableau au tableau reference par $TdT[$i]. Pour des rai- 
sons de clarte, vous pouvez preferer eviter cette construction. 

Mais il existe une situation dans laquelle vous voudrez l'utiliser. Supposons que @TdT est 
deja un tableau de references a des tableaux. C'est-a-dire que vous avez fait des affecta- 
tions comme : 

$TdT[3] = \(5>tableau_original; 

Et supposons maintenant que vous vouliez modifier @tableau_original (c'est-a-dire 
que vous voulez modifier la quatrieme ligne de $TdT) de facon a ce qu'il refere aux ele- 
ments de @tableau. Ce code fonctionnera : 

@{$TdT[3]} = @tableau; 
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Dans ce cas, la reference ne change pas, mais les elements du tableau reference chan- 
gent. Cela ecrase les valeurs de @tableau_original. 

Finalement, ce code dangereux en apparence fonctionne parfaitement : 

for $i (l. .10) { 

my ^tableau = fonction($i); 
$TdT[$i] = \@tableau; 

} 

C'est parce que la variable a portee lexicale my ^tableau est recreee completement a cha- 
que passage dans la boucle. Bien que vous ayez l'impression d'avoir stocke une reference 
a la meme variable a chaque fois, ce n'est en fait pas le cas. C'est une subtile distinction, 
mais cette technique peut produire du code plus efficace, au risque de tromper les pro- 
grammeurs moins eclaires. (C'est plus efficace car il n'y a pas de copie dans la derniere 
affectation.) D'un autre cote, s'il vous faut de toute facon copier les valeurs (ce que fait 
la premiere affectation de la boucle), vous pouvez aussi bien utiliser la copie impliquee 
par les crochets et eviter la variable temporaire : 

for $i (l. .10) { 

$TdT[$i] = [ fonction($i) ]; 

} 

En resume : 

$TdT[$i] = [ @tableau ]; # Plus sur, parfois plus rapide 
$TdT[$i] = \@tableau; # Rapide mais risque, depend du cote "my" 

# de (Stableau 

@{ $TdT[$i] } = @tableau; # Un peu ruse 

Une fois que vous maitrisez les tableaux de tableaux, vous voudrez vous mesurer a des 
structures de donnees plus complexes. Si vous cherchez les structures (struct) de C ou 
les enregistrements (record) de Pascal, vous ne trouverez aucun mot reserve en Perl qui 
en creera pour vous. Ce que vous avez en revanche est un systeme plus flexible. Si votre 
idee d'une structure est moins flexible que cela, ou si vous voulez fournir a vos utilisa- 
teurs quelque chose de plus rigide et de plus opaque, alors vous pouvez utiliser les fonc- 
tionnalites orientees objet detaillees au chapitre 12, Objets. 

Perl dispose de deux manieres d'organiser les donnees : comme des listes ordonnees 
dans des tableaux, dont l'acces aux elements se fait par leur position, ou comme des lis- 
tes non ordonnees de couples cle/valeur stockes dans des hachages et auxquels on accede 
par leur nom. La meilleure facon de representer un enregistrement en Perl consiste a 
utiliser une reference de hachage, mais la maniere d'organiser de tels enregistrements 
peut varier. Si vous desirez conserver une liste ordonnee de ces enregistrements et y ac- 
ceder par leur numero, vous utiliserez un tableau de references de hachages pour stac- 
ker les enregistrements. Ou bien, si vous preferez acceder a ces enregistrements par leurs 
noms, vous maintiendrez un hachage de references a des hachages. Vous pourriez 
meme faire les deux a la fois avec un pseudo-hachage. 

Dans les sections suivantes, vous trouverez des exemples de code decrivant comment 
composer (a partir de rien), generer (depuis d'autres sources), acceder a et afficher plu- 
sieurs structures de donnees differentes. Nous montrerons d'abord trois combinaisons 
evidentes de hachages et de tableaux, suivies par un hachage de fonctions puis des struc- 
tures de donnees plus irregulieres. Nous terminerons par la presentation d'une maniere 
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de sauver ces structures de donnees. Ces exemples supposent que vous vous etes deja fa- 
miliarise avec les explications qui precedent dans ce chapitre. 

Hachages de tableaux 

Utilisez un hachage de tableaux quand vous voulez acceder a chaque tableau par une 
chaine particuliere plutot que par un numero d'indice. Dans notre exemple de person- 
nages d'emissions de television, au lieu de parcourir la liste de noms a partir de la ze- 
roieme emission, la premiere et ainsi de suite, nous allons mettre en place notre 
structure de facon a pouvoir obtenir la liste des personnages a partir du nom du dessin 
anime. 

Comme notre structure de donnees est un hachage, nous ne pouvons pas en ordonner 
le contenu, mais nous pouvons utiliser la fonction sort pour specifier un ordre de sor- 
tie particulier. 

Composition d'un hachage de tableaux 

Vous pouvez creer un hachage de tableaux anonymes comme suit : 

# Nous omettons habituellement les guillemets quand les cles sont 

# des identificateurs. 
%HdT = ( 

flintstones => [ "fred", "barney" ], 

jetsons => [ "george", "jane", "elroy" ], 

Simpsons => [ "homer", "marge", "bart" ], 

); 

Pour ajouter un nouveau tableau au hachage, vous pouvez simplement ecrire : 
$HdT{teletubbies} = [ "tinky winky", "dipsy", "laa-laa", "po" ]; 

Generation d'un hachage de tableaux 

Voici quelques techniques pour remplir un hachage de tableaux. Pour le lire a partir 
d'un fichier avec le format suivant : 

flintstones: fred barney wilma dino 
jetsons: george jane elroy 
Simpsons: homer marge bart 

vous pourriez utiliser l'une des deux boucles suivantes : 

while ( <> ) { 

next unless s/ A (.*?) :\s*//; 
$HdT{$l} = [ split ]; 

} 

while ( $ligne = <> ) { 

($qui, $reste) = split /:\s*/, $ligne, 2; 
(Schamps = split ' $reste; 
$HdT{$qui} = [ (jDchamps ]; 

} 
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Si vous avez un sous-programme get_f amille qui renvoie un tableau, vous pouvez vous 
en servir pour remplir %HdT avec l'une de ces deux boucles : 

for $groupe ( "simpsons", "jetsons", "flintstones" ) { 
$HdT{$groupe} = [ get_famille($groupe) ]; 

} 

for $groupe ( "simpsons", "jetsons", "flintstones" ) { 
(Smembres = get_famille($groupe); 
$HdT{$groupe} = [ @membres ]; 

} 

Vous pouvez ajouter de nouveaux membres a un tableau existant comme ceci : 
push @{ $HdT{f lintstones} }, "wilma", "pebbles"; 

Utilisation et affichage d'un hachage de tableaux 

Vous pouvez fixer le premier element d'un tableau en particulier comme suit : 

$HdT{flintstones}[0] = "Fred"; 

Pour mettre en majuscule l'initiale du deuxieme Simpson, appliquez une substitution 
a l'element de tableau approprie : 

$HdT{simpsons}[l] =~ s/(\w)/\u$l/; 

Vous pouvez afficher toutes les families en bouclant sur toutes les cles du hachage : 

for $famille ( keys %HdT ) { 

print "$famille : (S){ $HdT{$famille} }\n"; 

} 

Avec un petit effort supplementaire, vous pouvez egalement ajouter les indices de ta- 
bleau : 

for $famille ( keys %HoA ) { 
print "$f amille : "; 
for $i ( 0 .. $#{ $HdT{$famille} } ) { 
print " $i = $HdT{$famille}[$i] "; 

} 

print "\n"; 

} 

Ou trier les tableaux par leur nombre d'elements : 

for $famille ( sort { @{$HdT{$b}} <=> @{$HdT{$a}} } keys %HdT ) { 
print "$famille : @{ $HdT{$famille} }\n" 

} 

Ou meme trier les tableaux par leur nombre d'elements puis trier les elements ASCII- 
betiquement (ou pour etre precis, « utf8-tiquement ») : 

# Affiche l'ensemble trie par le nombre de personnes et leurs noms. 
for $famille ( sort { (8{$HdT{$b}} <=> @{$HdT{$a}} } keys %HdT ) { 
print "$famille : join(", ", sort @{ $HdT{$famille} }), "\n"; 

} 
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Tableaux de hachages 

Un tableau de hachages est utile quand vous avez un tas d'enregistrements auxquels 
vous aimeriez acceder sequentiellement et que chaque enregistrement comporte des 
couples cle/valeur. Les tableaux de hachages sont moins frequemment utilises que les 
autres structures de ce chapitre. 

Composition d'un tableau de hachages 

Vous pouvez creer un tableau de hachages anonymes comme suit : 
@TdH = ( 
{ 

mari => "barney", 
femme => "betty", 
fils => "bamm bamm", 

}, 
{ 

mari => "george", 
femme => "jane", 
fils => "elroy", 

}, 
{ 

mari => "homer", 
femme => "marge", 
fils => "bart", 

}, 

); 

Pour ajouter un nouveau hachage au tableau, vous pouvez simplement ecrire : 
push @TdH, { mari => "fred", femme => "wilma", fille => "pebbles" }; 

Generation d'un tableau de hachages 

Voici quelques techniques pour remplir un tableau de hachages. Pour lire depuis un fi- 
chier ecrit selon le format suivant : 

mari=fred ami=barney 

vous pourriez utiliser l'une des deux boucles suivantes : 

while ( <> ) { 
$enrt = {}; 

for $champ ( split ) { 

($cle, $valeur) = split /=/, $champ; 
$enrt->{$cle} = $valeurj 

} 

push @TdH, $enrt; 

} 
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while ( <> ) { 

push @TdH, { split /[\s=]+/ }; 

} 

Si vous avez un sous-programme get_paire_suivante qui renvoie des couples cle/va- 
leur, vous pouvez l'utiliser pour remplir @TdH avec l'un de ces deux boucles : 

while ( @champs = get_paire_suivante() ) { 
push @TdH, { @champs }; 

} 

while (<>) { 

push @TdH, { get_paire_suivante($_) }; 

} 

Vous pouvez ajouter de nouveaux elements a un hachage existant comme ceci : 

$TdH[0]{animal} = "dino"; 
$TdH[2]{animal} = "petit papa Noel"; 

Utilisation et affichage d'un tableau de hachages 

Vous pouvez modifier un couple cle/valeur d'un hachage particulier comme suit : 

$TdH[0]{mari} = "fred"; 
Pour mettre en majuscule le mari du deuxieme hachage appliquez une substitution : 

$TdH[l]{mari} =~ s/(\w)/\u$l/; 

Vous pouvez afficher toutes les donnees comme suit : 

for $href ( @TdH ) { 
print "{ "; 

for $role ( keys %$href ) { 

print "$role=$href->{$role} "; 

} 

print "}\n"; 

} 

et avec les indices : 

for $i ( 0 .. $#TdH ) { 
print "$i est { 

for $role ( keys %{ $TdH[$i] } ) { 
print "$role=$TdH[$i]{$role} 

} 

print "}\n"; 

} 

Hachages de hachages 

Le hachage multidimensionnel est la plus souple des structures emboitees de Perl. Cela 
revient a construire un enregistrement qui contient d'autres enregistrement Vous in- 
dexez a chaque niveau avec des chaines (entre guillemets si besoin est). Souvenez vous 
cependant que les couples cle/valeur du hachage ne sortiront dans aucun ordre particu- 
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lier ; vous pouvez utiliser la fonction sort pour recuperer les couples dans Fordre qui 
vous interesse. 



Composition d'un hachage de hachage 

Vous pouvez creer un hachage de hachages anonymes comme suit : 

%HdH = ( 

flintstones => { 

mari => "fred", 
pote => "barney", 

}, 

jetsons => { 

mari => "george", 
femme => "jane", 

"son fils"=> "elroy", # Guillemets necessaires sur la cle 

}, 

Simpsons => { 

mari => "homer", 
femme => "marge", 
fiston => "bart", 

}, 

); 

Pour ajouter un autre hachage anonyme a %HdH, vous pouvez simplement ecrire : 

$HdH{ mash } = { 

capitaine => "pierce", 
major => "burns", 
caporal => "radar", 

}; 

Generation d'un hachage de hachages 

Voici quelques techniques pour remplir un hachage de hachages. Pour lire des donnees 
a partir d'un fichier dans le format suivant : 

flintstones: mari=fred pote=barney femme=wilma animal=dino 

vous pourriez utiliser l'une des deux boucles suivantes : 

while ( <> ) { 

next unless s/ A (.*?) :\s*//; 
$qui = $l; 

for $champ ( split ) { 

($cle, $valeur) = split /=/, $champ; 
$HdH{$qui}{$cle} = $valeur; 

} 

} 

while ( <> ) { 

next unless s/ A (.*?):\s*//; 
$qui = $1; 
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$enrt = {}; 
$HdH{$qui} = $enrt; 
for $champ ( split ) { 

($cle, $valeur) = split /=/, $champ; 

$enrt->{$cle} = $valeur; 

} 

} 

Si vous avez un sous-programme get_f amille qui renvoie une liste de couples cle/va- 
leur, vous pouvez vous en servir pour remplir %HdH avec Fun de ces trois bouts de code : 

for $groupe ( "simpsons", "jetsons", "flintstones" ) { 

$HdH{$groupe} = { get_famille($groupe) }; 
} " 

for $groupe ( "simpsons", "jetsons", "flintstones" ) { 
(ffimembres = get_famille($groupe) ; 
$HdH{$groupe} = { @membres }; 

} 

sub hash_familles { 
my @ret; 

for $groupe ( @_ ) { 

push @>ret, $groupe, { get_famille($groupe) }; 

} 

return @ret; 

} 

%HdH = hash_familles( "simpsons", "jetsons", "flintstones" ); 

Vous pouvez ajouter de nouveaux membres a un hachage comme suit : 

%nouveaux = ( 

femme => "wilma", 
animal => "dino"; 

); 

for $quoi (keys %nouveaux) { 

$HdH{flintstones}{$quoi} = $nouveaux{$quoi}; 

} 

Utilisation et affichage d'un hachage de hachages 

Vous pouvez modifier un couple cle/valeur d'un hachage particulier comme suit : 

$HdH{flintstones}{femme} = "wilma"; 

Pour mettre en majuscule la valeur associee a une cle particuliere, appliquez une subs- 
titution a un element : 

$HdH{jetsons}{'son fils'} =~ s/(\w)/\u$l/; 

Vous pouvez afficher toutes les families en bouclant sur les cles du hachage externe, puis 
en bouclant sur les cles du hachage interne : 

for $famille ( keys %HdH ) { 
print "$f amille : "; 
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for $role ( keys %{ $HdH{$famille} } ) { 
print "$role=$HdH{$famille}{$role} "; 

} 

print "\n"; 

} 

Dans les hachages tres grands, il peut etre un peu plus rapide de recuperer a la fois les 
cles et les valeurs en utilisant each (ce qui exclut le tri) : 

while ( ($famille, $roles) = each %HdH ) { 
print "$famille : "; 

while ( ($role, $personne) = each %$roles ) { 
print "$role=$personne "; 

} 

print "\n"; 

} 

(Helas, ce sont les grands hachages qui ont vraiment besoin d'etre tries, sinon vous ne 
trouverez jamais ce que vous cherchez dans ce qui est affiche.) Vous pouvez trier les fa- 
milies, puis les roles, comme suit : 

for $famille ( sort keys %HdH ) { 
print "$famille : "; 

for $role ( sort keys %{ $HdH{$famille} } ) { 
print "$role=$HdH{$famille}{$role} "; 

} 

print "\n"; 

} 

Pour trier les families par leur nombre de membres (plutot qu'ASCII-betiquement (ou 
utf8-tiquement)), vous pouvez utiliser keys en contexte scalaire : 

for $famille ( sort { keys %{$HdH{$a}} <=> keys %{$HdH{$b}} } keys %HdH ) { 
print "$famille : "; 

for $role ( sort keys %{ $HdH{$famille} } ) { 
print "$role=$HdH{$family}{$role} 

} 

print "\n"; 

} 

Pour trier les membres d'une famille dans un certain ordre, vous pouvez leur donner a 
chacun un rang : 

$i = 0; 

for ( qw(mari femme fils fille pote animal) ) { $rang{$_} = ++$i } 

for $famille ( sort { keys %{$HdH{$a}} <=> keys %{$HdH{$b}} } keys %HdH ) { 
print "$famille : "; 

for $role ( sort { $rang{$a} <=> $rang{$b} } keys %{ $HdH{$famille} } ) { 
print "$role=$HdH{$famille}{$role} 

} 

print "\n"; 
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Quand vous ecrivez une application complexe ou un service reseau en Perl, vous voulez 
probablement mettre un grand nombre de commandes a la disposition de vos utilisa- 
teurs. Un tel programme pourrait avoir du code comme celui-ci pour examiner le choix 
de l'utilisateur et agir en consequence : 



if 

elsif 
elsif 
elsif 
elsif 
elsif 
else { 
warn 

} 



($cmd 
($cmd 
($cmd 
($cmd 
($cmd 
($cmd 



=~ / A exit$/i) 

=~ / A help$/i) 

=~ / A watch$/i) 

=~ / A mail$/i) 

~ / A edit$/i) 

=~ / A delete$/i) 



{ exit } 

{ show_help() } 

{ $watch = 1 } 

{ mail_msg($msg) } 

{ $edited++; editmsg($msg); } 

{ conf irmkillQ } 



"Commande inconnue : r $cmd''; Essayez 'help' la prochaine fois\n"; 



Vous pouvez egalement stocker des references a des fonctions dans vos structures de 
donnees, tout comme vous pouvez y stocker des tableaux ou des hachages : 



%HdF = ( 




# Compose un hachage 


exit 


=> 


sub { exit }, 


help 


=> 


\&show_help, 


watch 


=> 


sub { $watch = 1 }, 


mail 


=> 


sub { mail msg($msg) }, 


edit 


=> 


sub { $edited++; editmsg($msg); }, 


delete 


=> 


\&confirm kill, 



); 

if ($HdF{lc $cmd}) { $HdF{lc $cmd}->() } # Appelle la fonction 

else { warn "Commande inconnue : '$cmd'; Essayez 'help' la prochaine fois\n" 

} 

Dans l'avant-derniere ligne, nous verifions si le nom de commande specifie (en minus- 
cules) existe dans notre « table de distribution » %HdF. Si c'est le cas, nous appelons la 
commande appropriee en dereferencant la valeur du hachage comme une fonction et 
passons a cette fonction une liste d'arguments vide. Nous pourrions aussi Favoir derefe- 
rencee comme &{ $HoF{lc $cmd} } (),ou a partirde la version 5.6 de Perl, simplement 
par$HoF{lc $cmd}(). 



Enregistrements plus elabores 

Jusqu'ici nous avons vu dans ce chapitre des structures de donnees simples, homogenes 
et a deux niveaux : chaque element contient le meme genre de referent que tous les 
autres elements de ce niveau. Ce n'est pas indispensable. Tout element peut contenir 
n'importe quel type de scalaire, ce qui signifie qu'il peut s'agir d'un chame, d'un nombre 
ou d'une reference a n'importe quoi d'autre. La reference peut etre une reference a un 
tableau ou a un hachage, ou a un pseudo-hachage, ou une reference a une fonction 
nommee ou anonyme, ou un objet. La seule chose que vous ne pouvez pas faire est de 
mettre plusieurs referents dans un seul scalaire. Si vous vous retrouvez a essayer de faire 
ce genre de chose, c'est le signe que vous avez besoin d'une reference a un tableau ou un 
hachage pour superposer plusieurs valeurs en une seule. 
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Dans les sections qui suivent, vous trouverez des exemples de code destines a montrer 
ce qu'il est possible de stacker dans un enregistrement, que nous implementerons com- 
me une reference a un hachage. Les cles sont en majuscules, une convention parfois em- 
ployee quand le hachage est utilise comme un type d'enregistrement specifique. 

Composition, utilisation et affichage d'enregistrements 
plus elabores 

Voici un enregistrement avec six champs de types differents : 

$enrt = { 

TEXTE => $chaine, 
SEQUENCE => [ @anc_valeurs ], 
RECHERCHE => { %une_table }, 
C0DE1 => \&une_fonction, 
CODE 2 => sub { $_[0] ** $_[1] }, 
HANDLE => \*STD0UT, 

}; 

Le champ TEXTE est une simple chaine, que vous pouvez done afficher : 

print $enrt->{TEXT}; 

SEQUENCE et RECHERCHE sont des references normales a un tableau et a un hachage : 

print $enrt->{SE0UENCE}[0]; 

$dernier = pop @{ $enrt->{SEQUENCE} }; 

print $enrt->{RECHERCHE}{"cle"}; 

($premier_c, $premier_v) = each %{ $enrt->{RECHERCHE} }; 

CODEl est un sous-programme nomme et C0DE2 un sous-programme anonyme, mais 
sont appeles de la mime facon : 

$reponsel = $enrt->{CODEl}->($argl, $arg2); 
$reponse2 = $enrt->{C0DE2}->($argl, $arg2); 

Avec une paire d'accolades supplementaires, pour pouvez traiter $rec->{HANDLE} com- 
me un objet indirect : 

print { $enrt->{HANDLE} } "une chaineV; 

Si vous utilisez le module FileHandle, vous pouvez mime traiter le handle comme un 
objet normal : 

use FileHandle; 

$enrt->{HANDLE}->autofIush(l); 
$enrt->{HANDLE}->print("une chaine\n"); 

Composition, utilisation et affichage d'enregistrements 
encore plus elabores 

Naturellement, les champs de vos structures de donnees peuvent eux-memes etre des 
structures de donnees arbitrairement complexes : 
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%TV = ( 

flintstones 
serie 
soirs 
membres 
{ nom 
{ nom 
{ nom 



=> { 

=> "flintstones", 
=> [ "lundi", "jeudi", "vendredi" 
=> [ 



h 



], 



■■> "fred", 
=> "wilma", 
=> "pebbles" 



role => "mari", 
role => "femme", 
role => "enfant", 



age 
age 
age 



=> 36, }, 
=> 31, }, 
=> 4, }, 



jetsons 
serie 
soirs 
membres 



}, 



], 



{ nom 
{ nom 
{ nom 



=> { 

=> "jetsons", 
=> [ "mercredi", 
=> [ 



'samedi" ], 



george , 
"jane", 
"elroy", 



role 
role 
role 



"mari", 

"femme", 

"enfant", 



age 
age 
age 



=> 41, }, 
=> 39, }, 
=> 9, }, 



); 



Simpsons => { 

serie => "simpsons", 

soirs => [ "lundi" ], 

membres => [ 

{ nom => "homer", role => "mari", 
{ nom => "marge", role => "femme", 
{ nom => "bart", role => "enfant", 

], 

}, 



age => 34, }, 
age => 37, }, 
age => 11, }, 



Generation d'un hachage d'enregistrements complexes 

Comme Perl est assez bon pour analyser des structures de donnees complexes, pour 
pouvez aussi bien mettre vos declarations de donnees dans un fichier separe comme du 
code Perl normal, puis le charger avec les fonctions integrees do ou require. Une autre 
approche courante est d'utiliser un module de CPAN (comme XML : : Parser) pour char- 
ger des structures de donnees quelconques ecrites dans un autre langage (comme XML). 

Vous pouvez construire vos structures de donnees petit a petit : 

$enrt = {}; 

$enrt->{serie} = "flintstones"; 
$enrt->{soirs} = [ quels_jours() ]; 

Ou les lire a partir d'un fichier (qu'on suppose ici ecrit sous la forme champ=valeur) : 

@membres = (); 
while (<>) { 

%champs = split /[\s=]+/; 

push (Bmembres, { %champs }; 

} 
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$enrt->{membres} = [ @membres ]; 

Puis les inclure dans des structures de donnees plus grandes, indexees par Fun des sous- 
champs : 

$TV{ $enrt->{serie} } = $enrt; 

Vous pouvez utiliser des champs supplementaires pour eviter de dupliquer les donnees. 
Par exemple, vous pourriez vouloir inclure un champ "enfants" dans l'enregistrement 
d'une personne, lequel pourrait etre une reference a un tableau contenant des referen- 
ces aux propres enregistrements des enfants. En ayant des parties de votre structure de 
donnees qui pointent sur d'autres, vous eviter les derives resultant de la mise a jour des 
donnees a un endroit mais pas a un autre : 

for $famille (keys %TV) { 

my $enrt = $TV{$famille}; # pointeur temporaire 
my @enfants = (); 

for $personne ( @{$enrt->{membres}} ) { 

if ($personne->{role} =~ /enfant |fils|fille/) { 
push (Senfants, $personne; 

} 

} 

# $enrt et $TV{$famille} pointent sur les memes donnees ! 
$enrt->{enfants} = [ (Benfants ]; 

} 

L'affectation $enrt->{enfants} = [ @enfants ] copie le contenu du tableau — maisce 
sont simplement des references a des donnees non copiees. Cela signifie que si vous mo- 
difiez l'age de Bart comme suit : 

$TV{simpsons}{enfants}[o]{age}++; # incremente a 12 

alors vous verrez le resultat suivant, car $TV{simpsons}{enfants}[0] et $TV{sim- 
psons}{membres}[2] pointent tous deux vers le meme hachage anonyme : 

print $TV{simpsons}{membres}[2]{age}; # affiche 12 egalement 

Et maintenant pour imprimer toute la structure de donnees %TV : 

for $famille ( keys %TV ) { 

print "la famille $famille"; 

print " passe ", join (" et ", @{ $TV{$famille}{nights} }), "\n"; 

print "ses membres sont :\n"; 

for $qui ( @{ $TV{$famille}{membres} } ) { 

print " $qui->{name} ($qui->{role}), age $qui->{age}\n"; 

} 

print "enfants: "; 

print join (", map { $_->{nom} } @{ $TV{$famille}{enfants} } ); 
print "\n\n"; 

} 

Sauvegarde de structures de donnees 

II existe plusieurs manieres de sauver vos structures de donnees pour les utiliser avec un 
autre programme par la suite. La maniere la plus simple consiste a utiliser le module 
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Data : : Dumper de Perl, qui convertit une structure de donnees (potientiellement auto- 
referente) en une chame qui peut etre sauvee pour etre reconstitute par la suite avec 
eval ou do. 

use Data: : Dumper; 

$Data: : Dumper :: Purity =1; # car %TV est autoreferent 

open (FILE, "> tvinfo.perldata") or die "impossible d'ouvrir tvinfo: $!"; 

print FILE Data : :Dumper->Dump( [\%TV] , [ J *TV]); 

close FILE or die "impossible de fermer tvinfo: $!"; 

Un autre programme (ou le mime programme) pourra lire le fichier plus tard : 

open (FILE, "< tvinfo.perldata") or die "impossible d'ouvrir tvinfo: $!"; 
undef $/; # lit tout le fichier cFun coup 

eval <FILE>; # recree %TV 

die "impossible de recreer les donnees depuis tvinfo.perldata: $@" if $@; 
close FILE or die "impossible de fermer tvinfo: $!"; 

print $TV{simpsons}{membres}[2]{age}; 

ou simplement : 

do "tvinfo.perldata" or die "impossible de recreer tvinfo: $! $@>"; 

print $TV{simpsons}{membres}[2]{age}; 

Beaucoup d'autres solutions sont disponibles, avec des formats de stockage qui vont des 
donnees binaires (tres rapide) au XML (tres interoperable). Visitez vite un miroir du 
CPAN pres de chez vous ! 
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Dans ce chapitre, nous allons pouvoir commencer a nous amuser, car nous allons abor- 
der la bonne conception des logiciels. Pour ce faire, parlons de Paresse, d'Impatience et 
d'Orgueil, les bases de la bonne conception des logiciels. 

Nous sommes tous tombes dans le piege du copier/coller alors qu'il fallait definir une 
abstraction de haut niveau, ne serait-ce qu'une boucle ou une routine simple. 1 II est vrai 
que certains partent a Fautre extreme en definissant des tas croissants d'abstractions de 
plus haut niveau alors qu'il aurait sufFi d'un copier/coller. 2 Mais en ge7neral, la plupart 
d'entre nous devraient penser a employer plus d'abstraction plutot que moins. 

Entre les deux se trouvent ceux qui ont une vision equilibree du degre d'abstraction ne- 
cessaire, mais qui se lancent dans la conception de leurs propres abstractions alors qu'ils 
devraient utiliser un code existant. 3 

Chaque fois que vous etes tente d'adopter l'une ou Fautre de ces attitudes, il vous faut 
d'abord vous asseoir et penser a ce qui sera le mieux pour vous et votre prochain a long 
terme. Si vous allez deverser vos energies creatives dans une masse de code, pourquoi ne 
pas rendre le monde meilleur pendant que vous y etes ? (Meme si vous ne visez qu'a re'us- 
sir le programme, vous devez vous assurer qu'il convient a la bonne niche ecologique.) 

La premiere etape vers une programmation ecologiquement soutenable est simple : pas 
de detritus dans le pare. Lorsque vous ecrivez un bout de code, pensez a lui donner son 
propre espace de noms, de sorte que vos variables et vos fonctions n'ecrasent pas celles 
de quelqu'un d'autre, ou vice-versa. Un espace de noms est un peu comme votre mai- 
son, dans laquelle il vous est permis d'etre aussi desordonne que vous le voulez, tant que 
votre interface externe avec les autres citoyens reste un tant soit peu correcte. En Perl, 
un espace de noms s'appelle un paquetage (package). Les paquetages fournissent la bri- 



1. Ce qui est une mauvaise forme de Paresse. 

2. Ce qui est une forme d'Orgueil mal place. 

3. Ce qui, vous l'avez devine, est une mauvaise forme d'Impatience. Mais si vous voulez vrai- 
ment reinventer la roue, essayez au moins d'en inventer une meilleure. 
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que de base sur laquelle les concepts de plus haut niveau de module et de classe sont 
elabores. 

Tout comme la notion de « maison », la notion de « paquetage » est un peu nebuleuse. 
Les paquetages sont independants des fichiers. On peut aussi bien avoir plusieurs paque- 
tages dans un seul fichier, ou un unique paquetage reparti sur plusieurs fichiers, tout 
comme votre maison peut etre soit une petite mansarde dans un grand batiment (si 
vous etes un artiste sans le sou), soit un ensemble de batiments (si votre nom se trouve 
etre Reine Elizabeth). Mais une maison est habituellement composee d'un seul bati- 
ment, comme un paquetage est habituellement compose d'un seul fichier. Avec Perl, 
vous pouvez mettre un paquetage dans un seul fichier, tant que vous acceptez de donner 
au fichier le meme nom que le paquetage et d'utiliser l'extension .pm, qui est l'abrevia- 
tion de « perl module ». Le module est l'unite fondamentale de reutilisation de Perl. En 
effet, pour utiliser un module, vous vous servez de la commande use, qui est une direc- 
tive de compilation qui controle l'importation des fonctions et des variables d'un mo- 
dule. Chaque exemple de use que vous avez vu jusqu'a maintenant est un exemple de 
reutilisation de module. 

Le Comprehensive Perl Archive Network, ou CPAN, est l'endroit ou mettre vos modules si 
d'autres personnes pouvaient les trouver utiles. Perl a prospere grace a la volonte des 
programmeurs a partager les fruits de leur travail avec la communaute. Evidemment, 
CPAN est egalement l'endroit ou vous pouvez trouver des modules que d'autres ont 
gentiment telecharge pour l'usage de tous. Voir le chapitre 22, CPAN, et ivww.cpan.org 
plus de details. 

Depuis 25 ans environ, il est a la mode de concevoir des langages informatiques qui im- 
posent un etat de paranoia. On attend de vous de programmer chaque module comme 
s'il etait en etat de siege. II existe sans doute certaines cultures feodales au sein desquelles 
ceci est justifiable, mais toutes les cultures ne sont pas ainsi faites. Dans la culture Perl, 
par exemple, on attend de vous que vous restiez en dehors de la maison de quelqu'un 
parce que vous n'y avez pas ete invite, et non parce qu'il y a des barreaux aux fenetres. 4 

Ceci n'est pas un livre sur la programmation orientee objet, et nous ne sommes pas la 
pour vous convertir en fanatique delirant de l'oriente objet, meme si justement vous 
souhaitez etre converti. II existe deja de nombreux livres disponibles sur ce sujet. La phi- 
losophic Perl de la conception orientee objet correspond parfaitement a la philosophic 
Perl de tout le reste ; utilisez la conception orientee objet (OO) la ou elle a un sens, et 
evitez-la la oil elle n'en a pas. A vous de voir. 

En parler OO, chaque objet appartient a un groupement appele classe. En Perl, les clas- 
ses, les paquetages et les modules sont tellement lies que les debutants peuvent souvent 
les considerer interchangeables. Typiquement, une classe est implementee par un mo- 
dule qui definit un paquetage ayant le meme nom que la classe. Nous expliquerons cela 
dans les quelques chapitres qui suivent. 

Lorsque vous utilisez un module avec use, vous beneficiez de la reutilisation directe de 
logiciel. Avec les classes, vous beneficiez de la reutilisation indirecte de logiciel lors- 
qu'une classe en utilise une autre par heritage. Avec les classes, vous gagnez quelque cho- 
se de plus : une interface propre avec un autre espace de noms. On n'accede a quelque 



4. Mais Perl fournit aussi des barreaux si vous le voulez. Voir Gestion des donnees non sures au 
chapitre 23, Securite. 
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chose dans une classe qu'indirectement, isolant ainsi la classe du monde exterieur. 

Comme nous l'avons indique dans le chapitre 8, References, la programmation orientee 
objet est realisee par des references dont les referents savent a quelle classe ils appartien- 
nent. En fait, maintenant que vous connaissez les references, vous connaissez presque 
tout ce que les objets ont de difficile. Le reste « se trouve sous les doigts », comme dirait 
un pianiste. Mais cependant il va falloir pratiquer un peu. 

Un de vos exercices de gammes de base consiste a apprendre comment proteger diffe- 
rents bouts de code pour qu'une partie n'altere pas par inadvertance les variables des 
autres parties. Chaque bout de code appartient a un paquetage bien defini, ce qui deter- 
mine quelles variables et quelles fonctions sont a sa disposition. Lorsque Perl rencontre 
un bout de code, il le compile dans le paquetage courant. Le paquetage courant initial est 
appele « main », mais vous pouvez passer du paquetage courant a un autre a tout mo- 
ment avec la declaration package. Le paquetage courant determine quelle table de sym- 
boles est utilisee pour trouver vos variables, fonctions, handles d'entree/sortie, et 
formats. 

Toute variable qui n'est pas declaree avec my est associee a un paquetage — meme des 
variables apparemment omnipresentes comme $_ et %SIG. En fait, les variables globales 
n'existent pas vraiment en Perl, ce sont simplement des variables de paquetage. (Les 
identificateurs speciaux comme _ et SIG ne sont qu'apparemment globaux, car ils sont 
par defaut dans le paquetage main plutot que dans le paquetage courant.) 

La portee d'une declaration package commence a la declaration elle-meme et se termi- 
ne a la fin de la portee qui la contient (bloc, fichier ou eval — celle qui arrive en pre- 
mier) ou jusqu'a une autre declaration package au meme niveau, qui remplace la 
precedente. (Ceci est une pratique courante.) 

Tous les identificateurs ulterieurs (dont ceux qui sont declares avec our, mais non ceux 
qui sont declares avec my ou qualifies avec le nom d'un autre paquetage) seront places 
dans la table de symboles appartenant au paquetage courant. (Les variables declarees 
avec my sont independantes des paquetages. Elles sont toujours visibles a l'interieur, et 
uniquement a finterieur, de la portee les contenant, quelles que soient les declarations 
de paquetage.) 

Une declaration de paquetage sera habituellement la premiere instruction d'un fichier 
destine a etre inclus par require ou use. Mais ce n'est qu'une convention. Vous pouvez 
mettre une declaration package partout ou vous pouvez mettre une instruction. Vous 
pouvez meme la mettre a la fin d'un bloc, auquel cas elle n'aura pas le moindre effet. 
Vous pouvez passer d'un paquetage a un autre a plus d'un endroit, car une declaration 
de paquetage ne fait que selectionner la table de symboles a utiliser par le compilateur 
pour le reste de ce bloc. (C'est ainsi qu'un paquetage donne peut se repartir sur plusieurs 
fichiers.) 

Vous pouvez faire reference aux identificateurs 5 appartenant a d'autres paquetages en 



5. Par identificateurs, nous designons les noms utilises comme clefs de table de symboles pour 
acceder aux variables scalaires, variables de tableau, variables de hachage, fonctions, handles de 
fichier ou de repertoire et formats. Syntaxiquement parlant, les etiquettes sont aussi des identifi- 
cateurs, mais elles ne sont pas placees dans une table de symboles precise ; elles sont plutot ratta- 
chees directement aux instructions de votre programme. Les etiquettes ne peuvent etre qualifiers 
par un paquetage. 
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les prefixant (« qualifiant ») avec leur nom de paquetage et un double deux-points : 
$Paquetage: :Variable. Si le nom du paquetage est nul, c'est le paquetage principal 
(main) qui est pris par defaut. C'est-a-dire que $::chaude est equivalent a 
$main: :chaude. 6 

L'ancien delimiteur de paquetage etait l'apostrophe, ainsi dans d'anciens programmes 
Perl vous verrez des variables comme $main 'chaude et $unpack , debiere. Mais le double 
deux-points est conseille parce qu'il est plus lisible, d'une part pour les humains, et 
d'autre part pour les macros emacs. II donne aussi aux programmeurs C++ le sentiment 
qu'ils savent ce qui se passe — alors que l'apostrophe etait la pour donner aux program- 
meurs Ada le sentiment de savoir ce qui se passe. Comme la syntaxe demodee est encore 
supportee pour la compatibilite arriere, si vous essayez d'utiliser une chaine comme 
"This is $owner's house", vous accederez a $owner: :s, c'est a dire la variable $s dans 
le paquetage owner, ce qui n'est probablement pas ce que vous vouliez dire. Utilisez des 
accolades pour eliminer l'ambigui'te, par exemple "This is ${owner}'s house". 

Le double deux-points peut etre utilise pour mettre bout a bout des identificateurs dans 
un nom de paquetage : $Rouge: :Bleu: :var. Ce qui veut dire : le $var appartenant au 
paquetage Rouge : : Bleu. Le paquetage Rouge : : Bleu n'a rien a voir avec un quelconque 
paquetage Rouge ou Bleu existant eventuellement. Une relation entre Rouge: :Bleu et 
Rouge ou Bleu peut avoir un sens pour la personne qui ecrit ou utilise le programme, 
mais n'en a aucun pour Perl. (Enfin, a part le fait que, dans l'implementation actuelle, 
la table de symboles Rouge : : Bleu se trouve etre rangee dans la table de symboles Rouge. 
Mais le langage Perl n'en fait aucun usage direct.) 

Pour cette raison, chaque declaration package doit declarer un nom de paquetage com- 
plet. Aucun nom de paquetage ne sous-entend un quelconque « prefixe », meme s'il est 
(apparemment) declare a l'interieur de la portee d'une autre declaration de paquetage. 

Seuls les identificateurs (les noms commencant par une lettre ou un souligne) sont ran- 
ges dans la table de symboles d'un paquetage. Tous les autres symboles sont gardes dans 
le paquetage main, notamment toutes les variables non-alphabetiques comme $!,$?, et 
$_. De plus, lorqu'ils ne sont pas qualifies, les identificateurs STDIN, STDOUT, STDERR, ARCV 
ARGVOUT, ENV INC et SIC se trouvent obligatoirement dans le paquetage main, meme lors- 
qu'ils sont utilises a d'autres fins que celles auxquelles ils sont destines par construction. 
Ne nommez pas votre paquetage m, s, y, tr, q, qq, qr, qw, ou qx sauf si vous cherchez beau- 
coup d'ennuis. Par exemple, vous ne pourrez pas utiliser la forme qualifiee d'un identi- 
ficateur comme handle de fichier, car il sera interprete au contraire comme une 
recherche de motif, une substitution ou une transliteration. 

Il y a longtemps, les variables commencant avec un souligne appartenaient obligatoire- 
ment au paquetage main, mais nous avons decide qu'il etait plus utile pour les createurs 
d'un paquetage de pouvoir utiliser un souligne en debut de nom pour indiquer des 
identificateurs semi-prives destines uniquement a l'usage interne de ce paquetage. (Des 
variables reellement privees peuvent etre declarees comme variables lexicales dans la 
portee d'un fichier, mais cela marche le mieux quand un paquetage et un module ont 



6. Pour eviter un autre sujet de confusion eventuelle, dans le cas d'un nom de variable comme 
$main : : chaude, nous utilisons le terme « identificateur » pour parler de main et de chaude, mais 
pas de main: : chaude, que nous nommons plutot nom de variable, car les identificateurs ne peu- 
vent pas contenir de deux-points. 
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une relation bijective, ce qui est courant mais pas obligatoire.) 

Le hachage %SIG (qui sert a intercepter les signaux, voir le chapitre 16, Communication 
interprocessus) est egalement special. Si vous definissez un gestionnaire de signal en tant 
que chaine, il est sous-entendu qu'il fait reference a une fonction du paquetage main, 
sauf si le nom d'un autre paquetage est explicitement utilise. Qualifiez completement 
le nom d'un gestionnaire de signal si vous voulez utiliser un paquetage specifique, ou 
evitez entierement les chaines en affectant plutot un typeglob ou une reference a une 
fonction : 

$SIG{QUIT} = "Pack: :attrape_quit"; # nom de gestionnaire qualifie 
$SIG{QUIT} = "attrape_quit"; # sous-entend "main: :attrape_quit" 

$SIG{QUIT} = *attrape_quit; # impose la fonction du paquetage courant 

$SIG{QUIT} = \&attrape_quit; # impose la fonction du paquetage courant 

$SIG{QUIT} = sub { print "Attrape SIGQUITAn" }; # fonction anonyme 

La notion de « paquetage courant » est un concept concernant a la fois la compilation 
et l'execution. La plupart des verifications de nom de variable se font a la compilation, 
mais les verifications a l'execution se font lorsque des references symboliques sont dere- 
ferencees et quand de nouveaux bouts de code sont analyses avec eval. En particulier, 
quand vous appliquez eval a une chaine, Perl sait dans quel paquetage eval a ete invo- 
que et propage ce paquetage vers l'interieur en evaluant la chame. (Bien sur, vous pou- 
vez toujours passer a un autre paquetage a l'interieur de la chaine eval, puisqu'une 
chaine eval compte pour un bloc, tout comme un fichier charge avec un do, un re- 
quire, ou un use.) 

D'un autre cote, si eval veut determiner dans quel paquetage il se trouve, le symbole 

special PACKAGE contient le nom du paquetage courant. Puisque vous pouvez le trai- 

ter comme une chaine, vous pourriez l'utiliser dans une reference symbolique pour ac- 
ceder a une variable de paquetage. Mais si vous faites cela, il y a des chances que vous 
ayez plutot interet a declarer la variable avec our, de sorte qu'on puisse y acceder comme 
si c'etait une variable lexicale. 



Tables de symboles 

Les elements contenus dans un paquetage sont dans leur ensemble appeles table de sym- 
boles. Les tables de symboles sont rangees dans un hachage dont le nom est le meme que 
celui du paquetage, avec un double deux-points ajoute a la fin. Ainsi le nom de la table 
de symboles principale, main, est %main : : . Puisque main se trouve aussi etre le paquetage 
par defaut, Perl fournit %: : comme abbreviation pour %main : : . 

De meme, la table de symboles du paquetage Rouge : : Bleu est appele %Rouge : : Bleu : : . 
II se trouve que la table de symboles main contient toutes les autres tables de symboles 
de haut niveau, elle-meme incluse, done %Rouge : : Bleu : : est aussi 
%main : : Rouge : : Bleu : : . 

Quand nous disons que la table de symboles « contient » une autre table de symboles, 
nous voulons dire qu'elle contient une reference a une autre table de symboles. Puisque 
main est le paquetage de plus haut niveau, il contient une reference a lui-meme, ainsi 
%main: : est pareil que %main: :main: :, et %main: :main: :main: :, et ainsi de suite, ad in- 
finitum. II est important de prevoir ce cas special si vous ecrivez du code qui parcourt 
toutes les tables de symboles. 
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A l'interieur du hachage d'une table de symboles, chaque couple clef/valeur fait corres- 
pondre a un nom de variable sa valeur. Les clefs sont les identificateurs de symbole et 
les valeurs les typeglobs correspondants. Done quand vous utilisez la notation typeglob 
*NOM, vous accedez en realite a une valeur dans le hachage qui contient la table de sym- 
boles du paquetage courant. En fait, les instructions suivantes ont (quasiment) le meme 
effet : 

*sym = *main: : variable; 
*sym = $main: : {"variable"}; 

La premiere est plus efficace car on accede a la table de symboles main au moment de la 
compilation. Elle creera aussi un nouveau typeglob de ce nom s'il n'en existait pas pre- 
cedemment, alors que la deuxieme version ne le fera pas. 

Puisqu'un paquetage est un hachage, vous pouvez rechercher les clefs du paquetage et 
recuperer toutes les variables du paquetage. Puisque les valeurs du hachage sont des ty- 
peglobs, vous pouvez les dereferencer de diverses facons. Essayez ceci : 

foreach $nomsym (sort keys %main::) { 
local *sym = $main : : {$nomsym}; 
print "\$$nomsym est defini\n" if defined $sym; 
print "\@$nomsym is non nul\n" if @sym; 
print "\%$nomsym is non nul\n" if %sym; 

} 

Puisque tous les paquetages sont accessibles (directement ou indirectement) par le pa- 
quetage main, vous pouvez ecrire du code Perl pour visiter chaque variable de paquetage 
de votre programme. C'est precisement ce que fait le debogueur Perl lorsque vous lui 
demandez d'afficher toutes vos variables avec la commande V Notez que si vous faites 
cela, vous ne verrez pas les variables declarees avec my, puisqu'elles sont independantes 
des paquetages, bien que vous verrez les variables declarees avec our. Voir le chapitre 20, 
Le debogueur Perl. 

Precedemment nous avons dit que seuls les identificateurs etaient ranges dans des pa- 
quetages autres que main. C'etait un tout petit mensonge : vous pouvez utiliser la chaine 
que vous voulez comme clef dans le hachage de la table de symboles — mais ca ne serait 
pas du Perl valide si vous essayiez d'utiliser un non-identificateur directement : 

$!@#$% =0; # FAUX j erreur de syntaxe. 

${'!@#$%'} =1; # Ok, mais non qualifie. 

${ J main: : !§#$%''} = 2; # On peut qualifier dans la chaine 

print ${ $main: :{' !@#$%'} } # Ok, imprime 2! 

Les typeglobs servent essentiellement d'alias : 

*dick = *richard; 

rend les variables, fonctions, formats, et handles de fichiers et repertoires accessibles par 
l'identificateur richard egalement accessibles par l'identificateur dick. Si vous ne sou- 
haitez affecter un alias qu'a une seule variable ou fonction, affectez plutot la reference : 

*dick = \$richard; 

Ce qui fait que $richard et $dick sont litteralement la meme variable, mais que @rich- 
ard et @dick restent des tableaux differents. Ruse, non ? 
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C'est ainsi que fonctionne le paquetage Exporter lorsque Ton importe des variables 
d'un paquetage vers un autre. Par exemple : 

*UnPack: :dick = \&AutrePack: :richard; 

importe la fonction &richard du paquetage AutrePack dans le paquetage UnPack, le ren- 
dant disponible comme fonction &dick. (Le module Exporter sera decrit dans le pro- 
chain chapitre.) Si vous precedez l'affectation avec un local, l'alias ne durera que le 
temps de la portee dynamique courante. 

Ce mecanisme peut etre utilise pour recuperer une reference a partir d'une fonction, 
rendant le referent disponible avec le type de donnees approprie : 

*unites = renseigner() ; # Affecter \%nouveau_hachage au typeglob 
print $unites{kg}; # Affiche 70; pas necessaire de dereferencer! 

sub renseigner { 

my %nouveau_hachage = (km => 10, kg => 70); 
return \%nouveau_hachage; 

} 

De meme, vous pouvez passer une reference a une fonction et l'utiliser sans la derefe- 
rencer : 

%unites = (kilometres => 6, kilos => 11); 
faireleplein( \%unites ); # Passer une reference 
print $unites{litres}; # Affiche 4 

sub faireleplein { 

local *hashsym = shift; # Affecter \%unites au typeglob 
$hashsym{litres} =4; # Modifie %unites; pas necessaire 

# de dereferencer ! 

} 

Ce sont des moyens astucieux de manipuler des references quand vous ne voulez pas de- 
voir les dereferencer explicitement. Notez que les deux techniques ne fonctionnent 
qu'avec des variables de paquetage. Elles ne marcheraient pas si on avait declare %unites 
avec my. 

Les tables de symboles s'utilisent aussi pour creer des scalaires « constants » : 
*PI = \3. 14159265358979; 

II vous est maintenant impossible d'alterer $PI, ce qui probablement une bonne chose, 
somme toute. Ceci n'est pas pareil qu'une fonction constante, qui est optimisee a la com- 
pilation. Une fonction constante est une fonction dont le prototype indique qu'elle ne 
prend pas de parametres et qu'elle retourne une expression constante ; voir pour plus 
de details la section Substitution en ligne defonctions constantes, chapitre 6, Sous-program- 
mes. Le pragma use constant est un raccourci commode : 

use constant PI => 3.14159; 

Sous le capot, ceci utilise la case « fonction » de *PI, plutot que la case « scalaire » uti- 
lised ci-dessus. L'expression suivante, plus compacte (mais moins lisible), est 
equivalente : 

*PI = sub () { 3.14159 }; 
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En tout cas c'est un idiome pratique a connaitre. Affecter un sub {} a un typeglob per- 
met de donner un nom a une fonction anonyme lors de l'execution. 

Affecter une reference a un typeglob a un autre typeglob (*sym = \*oldvar) revient a 
affecter the typeglob en entier, car Perl dereference automatiquement la reference au 
typeglob a votre place. Lorsque vous affectez simplement une chaine a une typeglob, 
vous obtenez le typeglob entier nomme par cette chaine, car Perl va chercher la chaine 
dans la table de symboles courante. Les instructions suivantes sont toutes equivalentes 
entre elles, bien que les deux premieres sont calculees a la compilation, alors que les 
deux dernieres le sont a l'execution : 

*sym = *anciennevar; 

*sym = \*anciennevar; # dereference auto 

*sym = \*{"anciennevar"}; # recherche explicite dans la table de symboles 

*sym = "anciennevar"; # recherche implicite dans la table de symboles 

Lorsque vous faites Fune des affectations suivantes, vous ne faites que remplacer Tune 
des references a l'interieur du typeglob : 

*sym = \$frodon; 
*sym = \@sam; 
*sym = \%merry; 
*sym = \&pippin; 

D'un autre point de vue, le typeglob lui-meme peut etre considere comme une espece 
de hachage, incluant des entrees pour les differents types de variables. Dans ce cas, les 
clefs sont fixees, puisqu'un typeglob contient exactement un scalaire, un tableau, un ha- 
chage, et ainsi de suite. Mais vous pouvez extraire les references individuelles, comme 
ceci : 



*pkg 


:sym{SCALAR} 


# pareil que \$pkg::sym 


*pkg 


:sym{ ARRAY} 


# pareil que \@pkg::sym 


*pkg 


:sym{HASH} 


# pareil que \%pkg::sym 


*pkg 


:sym{C0DE} 


# pareil que \&pkg::sym 


*pkg 


:sym{GL0B} 


# pareil que \*pkg::sym 


*pkg 


:sym{10} 


# handle de fichier/rep interne, pas d'equivalent direct 


*pkg 


:sym{NAME} 


# "sym" (pas une reference) 


*pkg 


:sym{ PACKAGE} 


# "pkg" (pas une reference) 



Vous pouvez dire *foo{PACKAGE} et *foo{NAME} pour determiner de quel nom et et de 
quel paquetage provient l'entree *f oo d'une table de symboles. Ceci peut etre utile dans 
une fonction a laquelle des typeglobs sont passes en parametres : 

sub identifiertypeglob { 
my $glob = shift; 

print 'Vous m'avez donne *{$glob}{PACKAGE}, *{$glob}{NAME}, 

"\n" 
} 

identif ier_typeglob(*f oo) ; 
identif ier_typeglob(*bar : rglarch); 

Ceci affiche : 

Vous m'avez donne main::foo 
Vous m'avez donne bar::glarch 
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La notation *foo{TRUC} peut etre utilisee pour obtenir des references aux elements in- 
dividuels de *f oo. Voir pour plus de details la section References de table de symboles, cha- 
pitre 8. 

Cette syntaxe est principalement utilisee pour acceder au handle de fichier ou de reper- 
toire interne, car les autres references internes sont deja accessibles d'autres facons. 
(L'ancien *foo{FILEHANDLE} reste supporte et signifie *foo{10}, mais ne laissez pas son 
nom vous faire croire qu'il peut distinguer entre des handles de fichier et de repertoire.) 
Nous avons pense generaliser cela parce que quelque part, c'est joli. Quelque part. Vous 
n'avez probablement pas a vous souvenir de tout cela sauf si vous avez l'intention d'ecri- 
re un autre debogueur de Perl. 

Autochargement 

Normalement, vous ne pouvez pas appeler une fonction non definie. Cependant, s'il y 
a une fonction nommee AUTOLOAD dans le paquetage de la fonction non definie (ou dans 
le cas d'une methode d'objet, dans le paquetage de l'une quelconque des classes de base 
de l'objet), alors la fonction AUTOLOAD est appelee avec les mimes parametres qui se- 
raient passes a la fonction d'origine. Vous pouvez definir la fonction AUTOLOAD pour 
qu'elle retourne des valeurs exactement comme une fonction normale, ou vous pouvez 
definir la fonction qui n'existait pas et ensuite l'appeler comme si elle avait existe tout 
du long. 

Le nom pleinement qualifie de la fonction d'origine apparait magiquement dans la va- 
riable globale au paquetage $ AUTO LOAD, dans le meme paquetage que la fonction AUTO- 
LOAD. Voici un exemple simple qui vous avertit gentiment lors des appels de fonctions 
non definies, au lieu d'arreter le programme. 

sub AUTOLOAD { 
our $AUT0L0AD; 

warn "la tentative d'appeler $AUT0L0AD a echoue.Nn"; 

} 

blarg(io); # notre $AUT0L0AD aura la valeur to main::blarg 

print "Encore vivant!\n" 

Ou vous pouvez retourner une valeur pour le compte de la fonction non definie : 

sub AUTOLOAD { 
our $AUT0L0AD; 

return "De vois $AUT0L0AD(@_)\n"; 

} 

print blarg(20); # affiche: De vois main: :blarg(20) 

Votre fonction AUTOLOAD pourrait charger une definition de la fonction non definie en 
utilisant eval ou require, ou utiliser l'astuce d'affectation au glob discutee precedem- 
ment, puis executer cette fonction en utilisant une forme speciale du goto qui peut ef- 
facer le « stack frame » de la fonction sans laisser de trace. Ici nous definissons la 
fonction en affectant une fermeture au glob : 

sub AUTOLOAD { 

my $nom = our $AUT0L0AD; 
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*$AUTOLOAD = sub { 
goto &$AUT0L0AD; 

} 



print "De vois $nom((S>_)\n" }; 
# Redemarrer la nouvelle fonction 



blarg(30); 
glarb(40); 
blarg(50); 



# affiche : je vois main: : blarg(30) 

# affiche : je vois main: :glarb(40) 

# affiche : je vois main: : blarg(50) 



Le module standard AutoSplit est utilise par les createurs de modules pour les aider a 
diviser leurs modules en plusieurs fichiers (avec des noms de fichier se terminant avec 
.al), chacun contenant une fonction. Les fichiers sont places dans le repertoire auto/ de 
la bibliotheque Perl de votre systeme, apres quoi les fichiers peuvent etre autocharges 
par le module standard Auto Loader. 

Une approche similaire est utilisee par le module Self Loader, mis a part qu'il autochar- 
ge des fonctions a partir de la zone DATA du fichier lui-meme, ce qui est moins efficace 
a certains egards, et plus efficace a d'autres. L'autochargement de fonctions Perl par Au- 
toLoader et Self Loader est analoque au chargement dynamique de fonctions C compi- 
lers par Dyna Loader, mais l'autochargement est fait avec la granularite d'un appel de 
fonction, alors que le chargement dynamique est fait avec la granularite d'un module 
entier, et liera en general un grand nombre de fonction C ou C++ a la fois. (Notez que 
beaucoup de programmeurs Perl se debrouillent tres bien sans les modules AutoSplit, 
AutoLoader, Self Loader, or DynaLoader. II faut juste que vous sachiez qu'ils sont la, au 
cas ou vous ne pourriez pas vous debrouiller sans eux.) 

On peut s'amuser avec des fonctions AUTOLOAD qui servent d'emballage pour d'autres in- 
terfaces. Par exemple, faisons semblant qu'une fonction qui n'est pas definie doive juste 
appeler system avec ses parametres. Tout ce que vous auriez a faire est ceci : 

sub AUTOLOAD { 

my $programme = our $AUT0L0AD; 

$programme =~ s/. *:://; # enlever le nom du paquetage 
system($programme, @_); 

} 

(Felicitations, vous venez d'implementer une forme rudimentaire du module Shell qui 
vient en standard avec Perl.) Vous pouvez appeler votre autochargeur (sur Unix) ainsi : 

date(); 

whoCam', 'i'); 
ls('-l'); 

echo("Ga bu zo meu..."); 

En fait, si vous predeclarez les fonctions que vous voulez appeler de cette facon, vous 
pouvez proceder comme si dies etaient pre-construites dans le langage et omettre les 
parentheses lors de l'appel : 

sub date (;$$); # Permettre de zero a deux parametres. 

sub who (;$$$$); # Permettre de zero a quatre parametres. 

sub Is; # Permettre un nombre quelconque de parametres. 

sub echo ($@>); # Permettre au moins un parametre. 



date; 

who "am", "i"; 
Is "-1"; 

echo "C'est tout pour 
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Le module est l'unite fondamentale de reutilisation de Perl. A bien le regarder, un mo- 
dule n'est qu'un paquetage defini dans un fichier de meme nom (avec .pm a la fin). Dans 
ce chapitre, nous allons explorer comment utiliser les modules des autres et creer les 
siens. 

Perl inclut en standard un grand nombre de modules, que vous pouvez trouver dans le 
repertoire lib de votre distribution Perl. Beaucoup de ces modules sont decrits au cha- 
pitre 32, Modules standards, et au chapitre 31, Modules de pragmas. Tous les modules stan- 
dard ont aussi une documentation detaillee en ligne, qui peut (scandale !) etre plus a 
jour que ce livre. Essayez la commande perldoc si votre commande man ne fonctionne 
pas. 

Le Comprehensive Perl Archive Network (CPAN) contient un depot de modules alimente 
par la communaute Perl mondiale, et est presente au chapitre 22, CPAN. Voir aussi 
http://www.cpan.org. 

Utilisation des modules 

II y a deux sortes de modules : traditionnel et oriente objet. Les modules traditionnels 
definissent des fonctions et des variables destinees a etre importees et utilisees par un 
programme qui y fait appel. Les modules orientes objet fonctionnent comme des defi- 
nitions de classe auxquelles on accede par des appels de methodes, decrites au chapitre 
12, Objets. Certains modules font les deux. 

Les modules Perl sont habituellement inclus dans votre programme en ecrivant : 

use MODULE LISTE; 
ou simplement : 

use MODULE; 

MODULE doit etre un identificateur qui nomme le paquetage et le fichier du module. (Les 
descriptions de syntaxe ne sont donnees ici qu'a titre indicatif, car la syntaxe complete 
de l'instruction use est detaillee au chapitre 29, Fonctions.) 
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L'instruction use precharge MODULE au moment de la compilation, puis importe les sym- 
boles que vous avez demandes pour qu'ils soient disponibles pour le reste de la compi- 
lation. Si vous ne fournissez pas une LISTE des symboles que vous voulez, les symboles 
nommes dans le tableau @EXP0RT interne au module sont utilises — en supposant que 
vous utilisez le module Exporter, decrit plus loin dans ce chapitre sous « Espace prive 
de module et Exporter ». (Si vous fournissez une LISTE, tous vos symboles doivent etre 
mentionnes, soit dans le tableau @EXP0RT, soit dans le tableau @EXP0RT_0K, faute de quoi 
une erreur en resultera.) 

Puisque les modules utilisent Exporter pour importer des symboles dans le paquetage 
courant, vous pouvez utiliser les symboles d'un module sans les qualifier avec le nom 
du paquetage : 

use Fred; # Si Fred.pm contient @EXP0RT = qw(pierrafeu) 

pierrafeuQ; # ...ceci appelle Fred: :pierrafeu() . 

Tous les fichiers de module Perl ont l'extension .pm. Ceci (ainsi que les doubles apostro- 
phes) est pris en compte par use ainsi que par require afin que vous n'ayez pas a ecrire 
"MODULE, pm". Cette convention permet de differencier les nouveaux modules des biblio- 
theques .pi et .ph utilisees dans d'anciennes versions de Perl. Elle definit aussi MODULE 
comme nom officiel de module, ce qui aide Fanalyseur dans certaines situations ambi- 
gues. Tout double deux-points dans le nom de module est traduit comme le separateur 
de repertoires de votre systeme, de sorte que si votre module a pour nom 
Rouge: :Bleu: :Vert, Perl pourrait le chercher sous Rouge/BleuA/ert.pm. 

Perl ira chercher vos modules dans tous les repertoires listes dans le tableau @INC. Com- 
me use charge les modules au moment de la compilation, toutes modifications au ta- 
bleau @INC doivent aussi survenir au moment de la compilation. Vous pouvez faire cela 
avec le pragma lib, decrit au chapitre 31 ou avec un bloc BEGIN. Une fois qu'un module 
est inclus, un couple clef/valeur sera ajoute au hachage %INC. La clef sera le nom de fi- 
chier du module (Rouge/Bleu/Vert. pm dans notre exemple) et la valeur sera le chemin 
complet, qui pourrait etre quelque chose comme 
C:/perl/site/lib/Rouge/Bleu/Vert.pm pour un fichier convenablement installe sur 
un systeme Windows. 

Les noms de module doivent commencer avec une lettre majuscule, sauf s'ils fonction- 
nent comme pragmas. Les pragmas sont essentiellement des directives de compilation 
(des conseils pour le compilateur), done nous reservons les noms de pragma en minus- 
cules pour un usage ulterieur. 

Lorsque vous utilisez un module avec use, tout le code du module est execute, tout com- 
me il le serait avec un require ordinaire. S'il vous est egal que le module soit pris en 
compte a la compilation ou a l'execution, vous pouvez juste dire : 

require MODULE; 

Cependant, en general on prefere use plutot que require, car il recherche les modules 
a la compilation, done vous decouvrez les erreurs eventuelles plus tot. 

Ces deux instructions font presque la meme chose : 

require MODULE; 
require "MODULE. pm"; 

Elles different neanmoins de deux facons. Dans la premiere instruction, require traduit 



Creation de modules 



277 



tout double deux-points en separateur de repertoire de votre systeme, tout comme le 
fait use. La deuxieme instruction ne fait pas de traduction, vous obligeant a specifier ex- 
plicitement le chemin de votre module, ce qui est moins portable. L'autre difference est 
que le premier require indique au compilateur que les expressions utilisant la notation 
objet indirecte avec « MODULE » (comme $ob = purgeMODL//.E) sont des appels de metho- 
de, pas des appels de fonction. (Si, ca peut reellement faire une difference, s'il y a une 
definition purge dans votre module qui entre en conflit avec une autre.) 

Comme la declaration use et la declaration apparentee no impliquent un bloc BEGIN, le 
compilateur charge le module (et execute son eventuel code d'initialisation) des qu'il 
rencontre cette declaration, avant de compiler le reste du fichier. C'est ainsi que les prag- 
mas peuvent modifier le comportement du compilateur, et que les modules peuvent 
declarer des fonctions qui sont par la suite visibles comme operateurs de liste pour le 
reste de la compilation. Ceci ne marchera pas si vous utilisez un require a la place d'un 
use. La seule raison d'utiliser un require est d'avoir deux modules dont chacun neces- 
site une fonction de l'autre. (Et nous ne sommes pas surs que ce soit une bonne raison.) 

Les modules Perl chargent toujours un fichier .pm, mais ce fichier peut a son tour char- 
ger des fichiers associes, comme des bibliotheques C ou C++ liees dynamiquement, ou 
des definitions de fonction Perl autochargees. Dans ce cas, les complications supplemen- 
taires seront entierement invisibles pour l'utilisateur du module. C'est la responsabilite 
du fichier .pm de charger (ou de s'arranger pour autocharger) toute fonctionnalite sup- 
plementaire. II se trouve que le module POSIX fait du chargement dynamique et de 
l'autochargement, mais l'utilisateur peut simplement dire : 

use POSIX; 

pour avoir acces a toutes les fonctions et variables exportees. 



Creation de modules 

Precedemment, nous avons dit qu'un module a deux facons de mettre son interface a la 
disposition de votre programme : en exportant des symboles ou en permettant des ap- 
pels de fonction. Nous vous montrerons un exemple de la premiere technique ici ; la 
deuxieme technique est utilisee pour les modules orientes objet, et est decrite dans le 
prochain chapitre. (Les modules orientes objet ne devraient rien exporter, car les me- 
thodes objet ont pour principe que Perl les trouve automatiquement a votre place en 
se basant sur le type de l'objet.) 

Pour construire un module appele Bestiaire, creez un fichier appele Bestiaire.pm qui 
ressemble a ceci : 

package Bestiaire; 
require Exporter; 



our @ISA = qw(Exporter) ; 

our @EXP0RT = qw(dromadaire); 
our @EXP0RT_0K = qw($poids); 
our $VERSI0N = 1.00; 



# Symboles a exporter par defaut 

# Symboles a exporter a la demande 

# Numero de version 



### Mettez vos variables et vos fonctions ici 
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sub dromadaire { print "Chameau a une seule bosse" } 
$poids = 1024; 

i; 

Maintenant un programme peut dire use Bestiaire pour pouvoir acceder a la fonction 
dromadaire (mais pas a la variable $poids), et use Bestiaire qw(dromadaire $poids) 
pour acceder a la fois a la fonction et a la variable. 

Vous pouvez egalement creer des modules qui chargent dynamiquement du code ecrit 
en C. Voir le chapitre 21, Mecanismes internes et acces extemes, pour plus de details. 

Espace privede module et Exporter 

Perl ne patrouille pas automatiquement le long de frontieres entre le prive et le public 
dans ses modules — ontrairement a des langages comme C++, Java et Ada, Perl n'est pas 
obsede par le droit a la vie privee. Un module Perl prefererait que vous restiez hors de 
son salon parce que vous n'y avez pas ete invite, pas parce qu'il a un fusil. 

Le module et son utilisateur ont un contrat, dont une partie se base sur la loi coutumie- 
re, et dont l'autre est ecrite. Une partie du contrat de loi coutumiere est qu'un module 
doit s'abstenir de modifier tout espace de noms qu'on ne lui a pas demande de modifier. 
Le contrat ecrit du module (c'est-a-dire la documentation) peut prendre d'autres dispo- 
sitions. Mais vous savez sans doute, apres avoir lu le contrat, que quand vous dites use 
Redef inirLeMonde vous redefinissez le monde, et vous etes pret a en risquer les conse- 
quences. La facon la plus commune de redefinir des mondes est d'utiliser le module Ex- 
porter. Comme nous le verrons plus loin dans ce chapitre, vous pouvez meme redefinir 
des fonctions Perl de base avec ce module. 

Lorsque vous faites appel a un module avec use, le module met habituellement certai- 
nes fonctions et variables a la disposition de votre programme, ou plus precisement du 
paquetage courant de votre programme. Cet acte d'exportation de symboles du module 
(et done d'importation dans votre programme) est parfois appele pollution de votre es- 
pace de noms. La plupart des modules utilisent Exporter pour faire cela. C'est pourquoi 
la plupart des modules disent quelque chose comme ceci vers le debut : 

require Exporter; 

our @ISA = ("Exporter"); 

Ces deux lignes font heriter au module de la classe Exporter. L'heritage est decrit au pro- 
chain chapitre, mais tout ce que vous avez besoin de savoir c'est que notre module Bes- 
tiaire peut maintenant exporter des symboles dans d'autres paquetages avec des lignes 
comme celle-ci : 

our @EXP0RT = qw($chameau %loup belier); # Exporter par defaut 
our @EXP0RT_0K = qw(leopard @lama $emeu); # Exporter a la demande 

our %EXPORT_TAGS = ( # Exporter en groupe 

camelides => [qw($chameau (Slama)], 
bestiaux => [qw(belier $chameau %loup)], 

); 

Du point de vue du module qui exporte, le tableau @EXP0RT contient les noms de varia- 
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bles et de fonctions a exporter par defaut : ce qu'obtient votre programme lorsqu'il dit 
use Bestiaire. Les variables et les fonctions dans @EXP0RT_0K ne sont exportees que 
lorsque le programme en fait explicitement la demande dans l'instruction use. Enfin, 
les couples clef/valeur dans %EXPORT_TAGS permettent au programme d'inclure des grou- 
pes de symboles specifiques, listes dans @EXP0RT et @EXP0RT_0K. 

Du point de vue du module qui importe, l'instruction use specifie la liste des symboles 
a importer, un groupe nomme %EXPORT_TAGS, un motif de symboles, ou rien du tout, 
auquel cas les symboles dans @EXP0RT seront importes du module dans votre program- 
me. 

Vous pouvez inclure Fune quelconque de ces instructions pour importer des symboles 
du module Bestiaire : 

use Bestiaire; # Importer les symboles de @EXP0RT 

use Bestiaire (); # Ne rien importer 

use Bestiaire qw(belier @lama); # Importer la fonction belier et le 

# tableau @lama 

use Bestiaire qw(:camelides); # Importer $chameau et @lama 
use Bestiaire qw(: DEFAULT); # Importer les symboles de @EXP0RT 
use Bestiaire qw(/am/); # Importer $chameau et @lama 

use Bestiaire qw(/ A \$/); # Importer tous les scalaires 

use Bestiaire qw(:bestiaux ! belier); 

# Importer bestiaux, mais exclure belier 
use Bestiaire qw(: bestiaux ! :camelides); 

# Importer bestiaux, mais pas camelides 

Omettre un symbole des listes d'exportation (ou le supprimer explicitement de la liste 
d'import avec le point d'exclamation) ne le rend pas inaccessible pour le programme 
qui utilise le module. Le programme pourra toujours acceder au contenu du paquetage 
du module en le qualifiant avec le nom du paquetage, comme par exemple %Besti- 
aire : : gecko. (Comme les variables lexicales n'appartiennent pas au paquetage, l'espace 
prive est possible : voir Methodes privies au chapitre suivant.) 

Vous pouvez dire BEGIN { $Exporter: :Verbose=l } pour voir comment sont gerees les 
specifications et pour voir ce qui est reellement importe dans votre paquetage. 

Exporter est lui-meme un module Perl, et si cela vous interesse vous pouvez voir les as- 
tuces typeglob qui sont utilisees pour exporter des symboles d'un paquetage a un autre. 
A Pinterieur du module Exporter, la fonction essentielle, appelee import, cree les alias 
necessaries pour qu'un symbole d'un paquetage soit visible dans un autre paquetage. En 
fait, l'instruction use BestiaireilSTE est precisement equivalente a : 

BEGIN { 

require Bestiaire; 
import Bestiaire LISTE; 

} 

Cela veut dire que vos modules ne sont pas obliges d'utiliser Exporter. Un module peut 
faire ce qui lui plait, puisque use ne fait qu'appeler la methode import du module, et 
vous pouvez definir cette methode pour qu'elle fasse ce que vous voulez. 
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Exporter sans utiliser la methode import de Exporter 

Le module Exporter definit une methode appelee export_to_level pour les situations 
oil vous ne pouvez pas directement appeler la methode import de Exporter. La metho- 
de export_to_level est invoquee comme ceci : 

MODULE- >export_to_level($ou_exporter, @quoi_exporter); 

L'entier $ou_exporter indique a quelle hauteur dans la pile d'appel exporter vos sym- 
boles, et le tableau $quoi_exporter liste les symboles a exporter (habituellement @_). 

Par exemple, supposons que notre Bestiaire contienne sa propre fonction import : 

package Bestiaire; 
@ISA = qw( Exporter); 
@EXP0RT_0K = qw ($zoo); 

sub import { 

$Bestiaire: :zoo = "menagerie"; 

} 

La presence de cette fonction import empeche d'heriter de la fonction import de Ex- 
porter. Si vous vouliez qu'apres avoir affecte a $Bestiaire : : zoo, la fonction import de 
Bestiaire se comporte exactement comme la fonction import de Exporter, vous la de- 
finiriez de la facon suivante : 

sub import { 

$Bestiaire: :zoo = "menagerie"; 
Bestiaire->export_to_level(l, @_) ; 

} 

Ceci exporte des symboles vers le paquetage situe un niveau « au-dessus » du paquetage 
courant, c'est-a-dire vers tout programme ou module qui utilise Bestiaire. 

Verification de version 

Si votre module definit une variable $VERSI0N, un programme qui utilise votre module 
peut s'assurer que le module est suffisamment recent. Par exemple : 

use Bestiaire 3.14; # Le Bestiaire doit etre de version 3.14 ou plus 
use Bestiaire vl.0.4; # Le Bestiaire doit etre de version 1.0.4 ou plus 

Ces instructions sont converties en appels a Bestiaire->require_version, dont herite 
ensuite votre module. 

Gestion de symboles inconnus 

Dans certaines situations, vous voudrez peut-etre empecher l'exportation de certains 
symboles. Typiquement, c'est le cas de certains modules qui ont des fonctions ou des 
constantes qui n'ont pas de sens sur certains systemes. Vous pouvez empecher Exporter 
d'exporter ces symboles en les placant dans le tableau @EXPORT_FAIL. 

Si un programme tente d'importer l'un de ces symboles, Exporter permet au module 
de gerer la situation avant de produire une erreur. II le fait en appelant une methode 
export_fail avec une liste des symboles qui ont echoue, que vous pouvez definir ainsi 
(en supposant que votre module utilise le module Carp) : 
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sub export_fail { 

my $class = shift; 

carp "Desole, ces symboles ne sont pas disponibles : 
return @_; 

} 

Exporter fournit une methode export_f ail par defaut, qui retoume simplement la lis- 
te inchangee et fait echouer le use en levant une exception pour chaque symbole. Si 
export_f ail retoume une liste vide, aucune erreur n'est enregistree et tous les symbo- 
les demandes sont exportes. 

Fonctions de gestion des etiquettes 

Comme les symboles listes dans %EXPORT_TAGS doivent egalement apparaitre, soit dans 
@EXP0RT, soit dans @EXP0RT_0K, Exporter fournit deux fonctions qui vous permettent 
d'aj outer ces ensembles de symboles etiquetes. 

%EXPORT_TAGS = (foo => [qw(aa bb cc)], bar => [qw(aa cc dd)]); 

Exporter: :export_tags('foo'); # ajouter aa, bb et cc a (SEXPORT 
Exporter: :export_ok_tags('bar''); # ajouter aa, cc et dd a @EXP0RT_0K 

C'est une erreur de specifier des noms qui ne sont pas des etiquettes. 

Supplanter des fonctions internes 

De nombreuses fonctions internes peuvent etre supplantees, bien que (comme pour fai- 
re des trous dans vos murs) vous ne devriez faire cela que rarement et pour de bonnes 
raisons. Typiquement, ce serait fait par un paquetage qui tente d'emuler des fonctions 
internes manquantes sur un systeme autre qu'Unix. (Ne confondez pas supplanter avec 
surcharger, qui ajoute des significations orientees objet supplementaires aux operateurs 
internes, mais ne supplante pas grand chose. Le module overload dans le chapitre 13, 
Surcharge, donne plus de details sur ce sujet.) 

On ne peut supplanter qu'en important le nom d'un module ; la predeclaration ordi- 
naire ne suffit pas. Pour etre parfaitement francs, c'est Faffectation d'une reference de 
code a un typeglob qui permet a Perl de supplanter, comme dans *open = \&myopen. 
De plus, Faffectation doit survenir dans un autre paquetage ; ceci rend intentionnelle- 
ment difficile de supplanter accidentellement par alias de typeglob. Malgre tout, si vous 
voulez vraiment supplanter vous-meme, ne desesperez pas, car le pragma subs vout per- 
met de predeclarer des fonctions avec la syntaxe d'importation, et ces noms supplantent 
alors ceux qui existent en interne : 

use subs qw(chdir chroot chmod chown); 
chdir $quelque_part 
sub chdir { . . . } 

En general, les modules ne doivent pas exporter des noms internes comme open ou 
chdir comme partie de leur liste @EXP0RT par defaut, puisque ces noms pourraient se 
glisser dans Fespace de noms de quelqu'un d'autre et en changer le contenu de facon 
inattendue. Si au lieu de cela le module inclut le nom dans la liste @EXP0RT_0K, les im- 
portateurs seront obliges de demander explicitement que le nom interne soit supplante, 
evitant ainsi les surprises. 
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La version d'origine des fonctions internes est toujours accessible via le pseudo-paque- 
tage CORE. En consequence, CORE::chdir sera toujours la version compilee d'origine 
dans Perl, meme si le mot-clef chdir a ete supplante. 

Enfin, presque toujours. Le mecanisme decrit ci-dessus pour supplanter les fonctions in- 
ternes est restreint, tres deliberement, au paquetage qui fait la demande d'importation. 
Mais il existe un mecanisme plus radical que vous pouvez utiliser lorsque vous souhaitez 
supplanter une fonction interne partout, sans prendre en compte les frontieres d'espa- 
ces de noms. Ceci est accompli en definissant la fonction dans le pseudo-paquetage 
CORE: : GLOBAL. Voyez ci-dessous un exemple qui supplante l'operateur glob avec quel- 
que chose qui comprend les expressions rationnelles. (Notez que cet exemple n'imple- 
mente pas tout ce qui est necessaire pour supplanter proprement le glob interne de 
Perl, qui se comporte differemment selon qu'il apparait dans un contexte scalaire ou un 
contexte de liste. En verite, de nombreuses fonctions internes de Perl ont de tels com- 
portements sensibles au contexte, et tout fonction visant a les correctement supplanter 
une fonction interne doit gerer adequatement ces comportements. Pour voir un exem- 
ple completement fonctionnel ou glob est supplante, etudiez le module File : : Glob in- 
clus avec Perl.) En tout cas, voici la version anti-sociale : 

*C0RE::GL0BAL::glob = sub { 
my $motif = shift; 
my @trouve; 
local *D; 

if (opendir D, '.') { 

(Sitrouve = grep /$motif/, readdir D; 
closedir D; 

} 

return @trouve; 

} 

package Ouelconque; 

print < A [a-z_]+\.pm\$>; # montrer tous les pragmas dans le repertoire 
courant 

En supplantant glob globalement, ceci impose un nouveau (et subversif) comporte- 
ment pour l'operateur glob dans tous les espaces de noms, sans la connaissance ou la 
cooperation des modules poprietaires de ces espaces de noms. Bien sur, s'il faut faire ce- 
la, il faut le faire avec la plus extreme prudence. Et probablement il ne faut pas le faire. 

Nous supplantons avec le principe suivant : c'est sympa d'etre important, mais c'est plus 
important d'etre sympa. 



12 

Objets 



Pour commencer, vous devez comprendre les paquetages et les modules ; voir le chapi- 
tre 10, Paquetages, et le chapitre 11, Modules. Vous devez aussi connaitre les references et 
les structures de donnees ; voir le chapitre 8, References, et le chapitre 9, Structures de don- 
nees. Comme il est utile de s'y connaitre un peu en programmation orientee objet, nous 
vous donnerons un petit cours de vocabulaire oriente objet dans la section suivante. 

Bref rappel de vocabulaire oriente objet 

Un objet est une structure de donnees munie d'une collection de comportements. Nous 
dirons parfois qu'un objet agit directement sur la base de comportements, allant parfois 
jusqu'a l'anthropomorphisme. Par exemple, nous dirons qu'un rectangle « sait » com- 
ment s'afficher a l'ecran ou qu'il « sait » comment calculer sa propre surface. 

Un objet exhibe des comportements en etant une instance d'une classe. La classe definit 
des methodes : des comportements qui s'appliquent a la classe et a ses instances. Lorsqu'il 
faut faire la distinction, nous appelons me'thode d'instance une methode qui ne s'appli- 
que qu'a un objet donne et methode de classe une methode qui s'applique a la classe dans 
son entier. Mais ce n'est qu'une convention : pour Perl, une methode n'est qu'une me- 
thode qui ne se distingue que par le type de son premier argument. 

Vous pouvez considerer qu'une methode d'instance est une action executee par un ob- 
jet donne, comme Taction de s'afficher, de se copier ou de modifier une ou plusieurs de 
ses proprietes (« affecter Anduril au nom de cette epee »). Les methodes de classe peu- 
vent executer des operations sur un ensemble d'objets (« afficher toutes les epees ») ou 
fournir d'autres operations qui ne dependent pas d'un objet particulier (« a partir de 
maintenant, a chaque fois qu'une nouvelle epee est forgee, enregistrer dans cette base 
de donnees le nom de son proprietaire »). Les methodes qui produisent des instances 
(ou objets) d'une classe sont appelees constructeurs (« creer une epee incrustee de pierres 
precieuses et avec une inscription secrete »). Celles-ci sont en general des methodes de 
classe (« fais-moi une nouvelle epee »), mais elles peuvent aussi etre des methodes d'ins- 
tance (« fais-moi une copie exacte de cette epee-ci »). 
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Une classe peut heriter des methodes de classes parentes, appelees aussi classes de base ou 
surclasses. Dans ce cas, on l'appelle classe derivee ou sous-classe. (Brouillant un peu les car- 
tes, certains livres entendent par « classe de base » la surclasse « racine », mais ce n'est 
pas ce que nous voulons dire.) Lorsque vous invoquez une methode dont la definition 
ne se trouve pas dans la classe, Perl consulte automatiquement les classes parentes pour 
chercher une definition. Par exemple, une classe « epee » pourrait heriter sa methode 
attaquer d'une classe generique « arme d'estoc et de taille ». Les classes parentes peu- 
vent elles-memes avoir des classes parentes, et Perl examinera egalement ces classes si 
besoin est. La classe « arme d'estoc et de taille » peut a son tour heriter la methode at- 
taquer d'une classe encore plus generique « arme ». 

Lorsque la methode attaquer est invoquee sur un objet, le comportement resultant 
peut varier, selon que l'objet est une epee ou une f leche. II se peut qu'il n'y ait aucune 
difference, ce qui serait le cas si les epees et les fleches heritaient leur comportement 
d'attaque de la classe arme generique. Mais s'il y avait une difference de comportement, 
le mecanisme d'acheminement de methode selectionnerait toujours la methode at- 
taquer la plus appropriee pour le type d'objet donne. Cette propriete fort utile de selec- 
tion du comportement le plus approprie pour un type donne d'objet s'appelle le 
polymorphisme. C'est une facon importante de ne se soucier de rien. 

Vous devez vous soucier des entrailles de vos objets lorsque vous implementez une clas- 
se, mais lorsque vous utilisez une classe (avec use), vous devriez traiter vos objets comme 
des « boites noires ». Vous ne voyez pas ce qu'il y a a l'interieur, vous n'avez pas besoin 
de savoir comment ca marche, et vous interagissez avec la boite sur ses termes : par les 
methodes fournies par la classe. C'est comme la telecommande de votre televiseur : 
meme si vous savez ce qui se passe dedans, vous ne devriez pas sans bonne raison tri- 
fouiller dans ses entrailles. 

Perl vous permet de scruter l'interieur d'un objet de l'exterieur de la classe lorsque vous 
en avez besoin. Mais de faire ainsi enfreint Yencapsulation, le principe qui separe l'inter- 
face publique (comment un objet doit etre utilise) de l'implementation (comment l'ob- 
jet fonctionne en realite). Perl ne fournit pas un dispositif d'interface explicite, mis a 
part le contrat implicite entre le concepteur et l'utilisateur. L'un et l'autre sont censes 
etre raisonnables et respectueux : l'utilisateur en ne dependant que de l'interface docu- 
mented, le concepteur en preservant cette interface. 

Perl ne vous impose pas un style de programmation particulier, et ne partage pas l'ob- 
session avec la vie privee d'autres langages de programmation orientee objet. Nean- 
moins Perl a l'obsession de la liberte, et l'une de vos libertes en tant que programmeur 
Perl est le droit de choisir si vous voulez beaucoup ou peu de vie privee. En fait, Perl 
permet un espace prive plus restrictif encore que C++. C'est-a-dire qu'il n'y a rien que 
Perl vous empeche de faire, et en particulier il ne vous empeche pas de vous empecher 
vous-meme, si ce genre de choses vous interesse. Les sections Methodes privees et Utilisa- 
tion defermetures pour objets prive's de ce chapitre vous montrent comment vous pouvez 
augmenter votre dose de discipline. 

Reconnaissons qu'il y a beaucoup plus a dire sur les objets, et beaucoup de facons d'en 
apprendre plus sur la conception orientee objet. Mais ce n'est pas notre propos. Conti- 
nuons done. 
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Le systeme objet de Perl 

Perl ne fournit pas de syntaxe objet particuliere pour definir les objets, les classes ou les 
methodes. Au lieu de cela, il reutilise des constructions existantes pour implementer ces 
trois notions. 1 

Voici quelques definitions simples que vous trouverez peut-etre rassurantes : 

Un objet n'est qu'une reference... enfin, un referent. 

Comme une reference permet de representer une collection de donnees avec un 
seul scalaire, il ne devrait pas etre surprenant qu'on utilise les references pour tous 
les objets. Pour etre precis, un objet n'est pas la reference elle-meme, mais plutot le 
referent sur lequel pointe la reference. Toutefois cette distinction est souvent 
brouillee par les programmeurs Perl, et comme nous trouvons que c'est une jolie 
metonymie, nous la perpetuons ici lorsque cela nous arrange. 2 

Une classe n'est qu'un paquetage. 

Un paquetage agit comme une classe en utilisant les fonctions du paquetage pour 
executer les methodes de la classe et en utilisant les variables du paquetage pour 
contenir les donnees globales de la classe. Souvent, on utilise un module pour con- 
tenir une ou plusieurs classes. 

Une me'thode n'est qu'une fonction. 

Vous declarez simplement des fonctions dans le paquetage que vous utilisez comme 
classe ; celles-ci seront ensuite utilisees comme methodes de la classe. L'invocation 
de methode, une nouvelle facon d'appeler une fonction, ajoute un parametre 
supplementaire : l'objet ou le paquetage utilise pour invoquer la methode. 

Invocation de methode 

Si vous aviez a reduire toute la programmation orientee objet a une notion essentielle, 
ce serait Y abstraction. C'est le fil conducteur de tous ces mots ronf lants qu'aiment em- 
ployer les enthousiastes OO, comme le polymorphisme, l'heritage et l'encapsulation. 
Nous croyons en ces mots savants, mais nous les traiterons du point de vue pratique de 
ce que signifie invoquer des methodes. Les methodes sont au cceur des systemes objet 
parce qu'elles fournissent la couche d'abstraction necessaire a l'implementation de ces 
termes savants. Au lieu d'acceder directement a une donnee residant dans un objet, 
vous invoquez une methode d'instance. Au lieu d'appeler directement une fonction 
dans un paquetage, vous invoquez une methode de classe. En interposant un niveau 
d'indirection entre l'utilisation d'une classe et son implementation, le concepteur de 
programme reste libre de bricoler le fonctionnement interne de la classe, sans grand ris- 
que d'invalider des programmes qui l'utilisent. 

Perl permet deux formes syntaxiques differentes pour invoquer les methodes. L'une uti- 
lise le style familier que vous avez deja vu ailleurs en Perl, et la seconde est une forme 



1. En voila un exemple de reutilisation de logiciel ! 

2. Nous preferons vigueur linguistique a rigueur mathematique. Vous serez d'accord ou non. 
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que vous aurez peut-etre deja rencontree dans d'autres langages de programmation. 
Quelle que soit la forme d'invocation de methode utilisee, un parametre initial supple- 
mentaire est passe a la fonction servant de methode. Si une classe est utilisee pour invo- 
quer la methode, ce parametre sera le nom de la classe. Si un objet est utilise pour 
invoquer la methode, ce parametre sera la reference a l'objet. Quel que soit ce parame- 
tre, nous l'appellerons invoquant de la methode. Pour une methode de classe, l'invo- 
quant est le nom d'un paquetage. Pour une methode d'instance, l'invoquant est la 
reference qui specifie un objet. 

En d'autres termes, l'invoquant est ce avec quoi la methode a ete invoquee. Certains li- 
vres OO l'appellent Yagent ou Vacteur de la methode. D'un point de vue grammatical, 
l'invoquant n'est ni le sujet de Taction, ni son destinataire. II est plutot comme un objet 
indirect, le beneficiaire au nom duquel Faction est executee — tout comme le mot 
« moi » dans la commande « Forge-moi une epee ! ». Semantiquement vous pouvez 
voir l'invoquant comme ce qui invoque ou ce qui est invoque, selon ce qui correspond 
mieux a votre appareil mental. Nous n'allons pas vous dire comment penser. (Pas sur ce 
sujet-la, en tout cas.) 

La plupart des methodes sont invoquees explicitement, mais des methodes peuvent aus- 
si etre invoquees implicitement lorsqu'elles sont declenchees par un destructeur d'ob- 
jet, un operateur surcharge ou une variable liee. Ce ne sont pas a proprement parler des 
appels de fonction ordinaires, mais plutot des invocations de methode declenchees 
automatiquement par Perl au nom de l'objet. Les destructeurs sont decrits plus loin 
dans ce chapitre, la surcharge est decrite dans le chapitre 13, Surcharge, et les variables 
liees sont decrites dans le chapitre 14, Variables liees. 

Les methodes et les fonctions normales different par le moment auquel leur paquetage 
est resolu — c'est-a-dire, le moment ou Perl decide quel code doit etre execute pour la 
methode ou la fonction. Le paquetage d'une fonction est resolu a la compilation, avant 
que le programme ne commence a s'executer. 3 Au contraire, le paquetage d'une metho- 
de n'est resolu que lorsqu'elle est effectivement invoquee. (Les prototypes sont verifies 
a la compilation, c'est pourquoi les fonctions normales peuvent les utiliser, mais les me- 
thodes ne le peuvent pas.) 

La raison pour laquelle le paquetage d'une methode ne peut pas etre resolu plus tot est 
relativement evidente : le paquetage est determine par la classe de l'invoquant, et l'in- 
voquant n'est pas connu tant que la methode n'a reellement ete invoquee. Au cceur de 
TOO est cette simple chaine logique : si on connait l'invoquant, on connait la classe de 
l'invoquant ; si on connait la classe, on connait l'heritage de la classe ; si on connait l'he- 
ritage de la classe, on connait la fonction a appeler. 

La logique de l'abstraction a un cout. A cause de la resolution tardive des methodes, une 
solution orientee objet en Perl risque de s'executer plus lentement que la solution non- 
OO correspondante. Pour certaines des techniques sophistiquees decrites plus loin, elle 
pourrait etre beaucoup plus lente. Toutefois, la solution de beaucoup de problemes n'est 



3. Plus precisement, l'appel de fonction est resolu jusqu'a un typeglob specifique, et une refe- 
rence a ce typeglob est rentree dans Farbre d'opcodes compiles. Le sens de ce typeglob est nego- 
ciable meme au moment de l'execution — c'est ainsi que AUTOLOAD peut vous autocharger une 
fonction. Normalement, cependant, le sens du typeglob est aussi resolu a la compilation par la 
definition d'une fonction nommee de facon correspondante. 
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pas de travailler plus vite, mais de travailler plus intelligemment. C'est la que brille 
TOO. 

Invocation de methode avec Voperateur fleche 

Nous avons indique qu'il existe deux styles d'invocation de methode. Le premier style 
se presente comme ceci : 

INVOOUANT- >METHODE(LISTE) 
INVOOUANT- >METHODE 

Pour des raisons evidentes, ce style est habituellement appele la forme fleche d'invoca- 
tion. (Ne confondez pas -> avec =>, la fleche « a deux coups » utilisee comme virgule 
de luxe.) Les parentheses sont exigees s'il y a des parametres. Lorsqu'elle est executee, 
l'invocation commence par trouver la fonction determinee conjointement par la classe 
de V INVOOUANT et par le nom de la METHODE, lui passant INVOOUANT comme premier pa- 
rametre. 

Lorsque INVOOUANT est une reference, nous disons que METHODE est invoquee comme me- 
thode d'instance, et lorsque INVOOUANT est un nom de paquetage, nous disons que METH- 
ODE est invoquee comme methode de classe. II n'y a en realite aucune difference entre 
les deux, mis a part que le nom de paquetage est plus clairement associe a la classe elle- 
meme qu'avec les objets de la classe. Vous allez devoir nous faire confiance lorsque nous 
disons que les objets connaissent leur classe. Nous vous dirons bientot comment asso- 
cier un objet a un nom de classe, mais vous pouvez utiliser les objets sans savoir cela. 

Par exemple, pour construire un objet avec la methode de classe invoquer puis invo- 
quer la methode d'instance dire sur l'objet resultant, vous pourriez dire ceci : 

$mage = Magicien->invoquer("Gandalf "); # methode de classe 
$mage->dire("ami"); # methode d'instance 

Les methodes invoquer et dire sont definies par la classe Magicien — ou par une des 
classes dont elle herite. Mais ne vous inquietez pas de cela. Ne vous melez pas des affai- 
res de Magiciens. 

Comme l'operateur fleche est associatif vers la gauche (voir le chapitre 3, Operateurs 
unaires et binaires), vous pouvez meme combiner les deux instructions : 

Magicien- >invoquer("Gandalf ")->dire("ami"); 

Parfois vous souhaiterez invoquer une methode sans connaitre son nom par avance. 
Vous pouvez utiliser la forme fleche d'invocation et remplacer le nom de methode avec 
une simple variable scalaire : 

$methode = "invoquer"; 

$mage = Magicien->$methode("Gandalf "); # Invoquer Magicien->invoquer 

$voyager = $compagnon eq "Grispoil" ? "monter" : "marcher"; 
$mage->$voyager("sept lieues"); # Invoquer $mage->monter ou 

# $mage->marcher 

Bien que vous utilisiez le nom d'une methode pour l'invoquer indirectement, cet usage 
n'est pas interdit par use strict 'ref s', car tous les appels de methode sont en fait re- 
cherches par symbole au moment ou ils sont resolus. 
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Dans notre exemple, nous stockons le nom d'une fonction dans $voyager, mais vous 
pourriez aussi stacker une reference de fonction. Ceci contourne l'algorithme de recher- 
che de methode, mais parfois c'est exactement ce que vous voulez faire. Voir la section 
Methodes privees et la discussion de la methode can dans la section UNIVERSAL : la classe 
ancetre ultime. Pour creer une reference a la methode specifique d'appel pour une ins- 
tance specifique, voir la section Fermetures dans le chapitre 8. 

Invocation de methode avec des objets indirects 

Le second style d'invocation de methode se presente comme ceci : 

METHODE INVOOUANT (LISTE) 
METHODE INVOOUANT LISTE 
METHODE INVOOUANT 

Les parentheses autour de LISTE sont optionnelles ; si elles sont omises, la methode se 
comporte comme un operateur de liste. Vous pouvez done avoir des instructions com- 
me les suivantes, toutes utilisant ce style d'appel de methode : 

$mage = invoquer Magicien "Gandalf"; 

$nemesis = invoquer Balrog demeure => "Moria", arme => "fouet"; 

deplacer $nemesis "pont"; 

dire $mage "Tu ne peux pas passer"; 

briser $baton; # il est plus sur d'utiliser : briser $baton (); 

La syntaxe d'operateur de liste devrait vous etre familiere, car c'est le meme style qu'on 
utilise pour passer des handles de fichiers a print ou a printf : 

print STDERR "au secours !!!\n"; 

Elle est egalement similaire a des phrases en francais comme « Donner (a) Gollum le 
tresor », done nous l'appelons la forme avec objet indirect. L'invoquant est attendu dans 
la case d'objet indirect. Lorsqu'il est fait mention de passer quelque chose a une fonction 
interne comme system ou exec dans sa « case d'objet indirect », cela veut dire que vous 
fournissez ce parametre supplementaire et depourvu de virgule au meme endroit que 
vous le feriez si vous invoquiez une methode avec la syntaxe d'objet indirect. 

La forme avec objet indirect vous permet meme de specifier que VINVOOUANT soit un 
BLOC evaluable comme objet (reference) ou comme classe (paquetage). Ce qui vous per- 
met de combiner deux invocations en une instruction ainsi : 

dire { invoquer Magicien "Candalf" } "ami"; 

Pieges syntaxiques avec les objets indirects 

Une syntaxe sera souvent plus lisible que l'autre. La syntaxe d'objet indirect est moins 
lourde, mais souffre de plusieurs sortes d'ambiguite syntaxique. La premiere est que la 
partie LISTE d'une invocation avec objet indirect est analysee de la meme facon que 
tout autre operateur de liste. Ainsi, les parentheses de : 

enchanter $epee ($points + 2) * $cout; 

sont censees entourer tous les parametres, quel que soit ce qui suit. Cela equivaut a : 

($epee->enchanter($points + 2)) * $cout; 
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Cela ne fait probablement pas ce que vous pensez : enchanter n'est appelee qu'avec 
$points + 2, et la valeur de retour de la methode est ensuite multipliee par $cout. Com- 
me avec d'autres operateurs de liste, vous devez faire attention a la precedence de && et 
de | | par rapport a and et a or. 

Par exemple ceci : 

appeler $epee $ancien_nom | | "Glamdring"; # ne pas utiliser "or" ici ! 
devient comme prevu : 

$epee->appeler($ancien_nom | | "Glamdring"); 
mais ceci : 

dire $mage "ami" && entrer(); # il aurait fallu "and" ici ! 

devient le douteux : 

$mage->dire("ami" && entrer()); 

qui pourrait etre corrige en recrivant avec une des formes equivalentes : 

entrerQ if $mage->dire("ami"); 
$mage->dire("ami") && entrer(); 
dire $mage "ami" and entrerQ; 

Le deuxieme ennui syntaxique de la forme avec objet indirect est que YINVOOUANT ne 
peut etre qu'un nom, une variable scalaire non-indicee ou un bloc. 4 Des que l'analyseur 
voit une de ces choses, il a son INVOQUANT, done il commence a chercher sa LISTE. Ainsi 
ces invocations : 

deplacer $groupe->{CHEF}; # probablement faux ! 

deplacer $cavaliers[$i] ; # probablement faux ! 

sont en fait analysees comme celles-ci : 

$groupe->deplacer->{CHEF}; 
$cavaliers->deplacer([$i]); 

au lieu de ce que vous vouliez sans doute : 

$groupe->{CHEF}->deplacer; 
$cavaliers[$i] ->deplacer; 

L'analyseur ne regarde qu'un petit peu vers l'avant pour trouver l'invoquant d'un objet 
indirect, pas meme aussi loin qu'il ne regarderait dans le cas d'un operateur unaire. Cet- 
te bizarrerie n'a pas lieu avec la premiere forme syntaxique, done vous souhaiterez peut- 
etre faire de la f leche votre arme de choix. 

Meme en francais il peut se poser un probleme similaire. Pensez a l'instruction : 
« Envoyez-moi par la poste la lettre pour que je la lise ». Si vous analysez cette phrase 
trop vite, vous finirez par envoyer quelqu'un, et non pas une lettre, par la poste. Comme 
Perl, le francais a parfois deux syntaxes differentes pour decrire un agent : « Envoyez- 
moi la lettre » et « Envoyez la lettre a moi ». Parfois la forme plus longue est plus claire 
et plus naturelle, et parfois e'est le contraire. Au moins en Perl, vous etes oblige d'utiliser 
des accolades autour d'un objet indirect complexe. 



4. Les lecteurs attentifs se souviendront que e'est precisement la meme liste d'items syntaxiques 
qui sont permis apres les droles de caracteres ($, @, % ou *) pour indiquer un dereferencement de 
variable — par exemple, ^tableau, @$ref_tableau ou @{$ref_tableau}. 



290 



Chapitre 12 — Objets 



Classes a paquetage explicite 



La derniere ambigui'te syntaxique du style d'invocation de methode avec objet indirect 
est qu'elle peut ne pas du tout etre analysee comme appel de methode, parce que le pa- 
quetage courant peut contenir une fonction ayant le mime nom que la methode. Lors- 
que vous utilisez une methode de classe avec un nom de paquetage litteral comme 
invoquant, il y a moyen de resoudre cette ambigui'te tout en gardant la syntaxe d'objet 
indirect : explicitez le nom de paquetage en y ajoutant un double deux-points. 

$obj = methode CLASSE::; # imposer "CLASSE" ->methode 

Ceci est important car la notation courante : 

$obj = new CLASSE; # pourrait ne pas etre analyse comme methode 

ne se comportera pas toujours correctement si le paquetage courant comporte une fonc- 
tion nommee new ou CLASSE. Meme si prudemment vous utilisez la forme avec fleche 
au lieu de la forme avec objet indirect pour invoquer des methodes, ceci peut, rarement, 
rester un probleme. Au prix d'un peu plus de ponctuation, la notation CLASSE : : garan- 
tit comment Perl analysera votre invocation de methode. Dans les exemples suivants, 
les deux premiers ne sont pas toujours analyses de la meme facon, mais les deux der- 
niers le sont : 

$obj = new AnneauElf ique; # pourrait etre new("AnneauElf ique") 

# ou meme new(AnneauElfique()) 
$obj = AnneauElf ique->new; # pourrait etre AnneauElf ique()->new() 

$obj = new AnneauElfique::; # toujours "AnneauElf ique"->new() 

$obj = AnneauElf ique: : ->new; # toujours "AnneauElf ique"->new() 

Cette notation de paquetage explicite peut etre enjolivee avec un peu d'alignement : 

$obj = new AnneauElfique:: 

nom => "Narya", 

proprietaire => "Gandalf", 
domaine => "feu", 
pierre => "rubis"; 

Neanmoins, vous vous exclamerez peut-etre « Qu'il est laid ! » en voyant ce double 
deux-points, done nous vous dirons que vous pouvez presque toujours vous en sortir 
avec un simple nom de classe, a deux conditions. Premierement, qu'il n'y ait pas de fonc- 
tion avec le meme nom que la classe. (Si vous observez la convention que les noms de 
fonction comme new commencent avec une lettre minuscule, et que les noms de classe 
comme AnneauElfique commencent avec une majuscule, ceci ne posera jamais de pro- 
bleme.) Deuxiemement, que la classe soit chargee avec l'une des instructions suivantes : 

use AnneauElfique; 
require AnneauElfique; 

Chacune de ces declarations assure que Perl sait que AnneauElfique est un nom de mo- 
dule, ce qui oblige tout nom simple comme new avant le nom de classe AnneauElfique 
a etre interprets comme un appel de methode, meme s'il se trouve que vous avez vous- 
meme declare une fonction new dans le paquetage courant. On ne rencontre habituel- 
lement de probleme avec les objets indirects que si Ton entasse plusieurs classes dans un 
meme fichier, auquel cas Perl ne sait pas forcement qu'un paquetage specifique etait 
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cense etre un nom de classe. Ceux qui nomment des fonctions avec des noms qui res- 
semblent a NomsDeModule finissent egalement par le regretter un jour ou Fautre. 

Construction d'objet 

Tout objet est une reference, mais toute reference n'est pas un objet. Une reference ne 
fonctionnera comme objet que si son referent est marque specialement pour dire a Perl 
a quel paquetage il appartient. On appelle consacrer (du sens anglais de la fonction 
bless) Facte de marquer un referent avec le nom d'un paquetage — et done de sa classe, 
puisqu'une classe n'est qu'un paquetage. Vous pouvez considerer que consacrer une re- 
ference la transforme en objet, bien qu'il soit plus precis de dire que cela transforme la 
reference en reference a un objet. 

La fonction bless prend un ou deux parametres. Le premier parametre est une referen- 
ce et le deuxieme est le paquetage avec lequel est consacre le referent. Si le deuxieme 
parametre est omis, e'est le paquetage courant qui est utilise. 

$obj = { }; # Obtenir une reference a un hachage anonyme. 

bless($obj); # Consacrer le hachage avec le paquetage courant. 

bless($obj, "Bestiau"); # Consacrer le hachage avec la classe Bestiau. 

Ici nous avons utilise une reference a un hachage anonyme, ce que les gens utilisent ha- 
bituellement comme structure de donnees pour leurs objets. Les hachages sont apres 
tout extremement f lexibles. Mais permettez-nous de souligner que vous pouvez consa- 
crer une reference a toute chose a laquelle vous pouvez faire une reference en Perl, com- 
me les scalaires, les tableaux, les fonctions et les typeglobs. Vous pouvez meme consacrer 
une reference au hachage de la table de symboles d'un paquetage si vous trouvez une 
bonne raison de le faire. (Ou meme si vous n'en trouvez pas.) L'orientation objet de Perl 
est entierement distincte de la structure des donnees. 

Une fois que le referent est consacre, l'appel de la fonction interne ref sur sa reference 
retourne le nom de la classe consacree au lieu du type de base, comme HASH. Si vous vou- 
lez le type de base, utilisez la fonction reftype du module attributes. Voir use at- 
tributes dans le chapitre 31, Modules de pragmas. 

Voila comment creer un objet. Prenez simplement une reference a quelque chose, don- 
nez-lui une classe en la consacrant avec un paquetage, et vous avez termine. C'est tout 
ce que vous avez a faire si vous creez une classe minimale. Si vous utilisez une classe, 
vous avez encore moins a faire, car Fauteur de la classe aura cache le bless a l'interieur 
d'une fonction nommee constructeur, qui cree et retourne des instances de la classe. 
Comme bless retourne son premier parametre, un constructeur typique peut etre aussi 
simple que ceci : 

package Bestiau; 

sub engendrer { bless {}; } 

Ou, pour etre un peu plus explicite : 

package Bestiau; 
sub engendrer { 

my $self = {}; # Reference a un hachage anonyme vide 

bless $selfj "Bestiau"; # Faire de ce hachage un objet Bestiau 
return $self; # Retourner le Bestiau nouvellement creee 

} 
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Muni de cette definition, voici comment on pourrait creer un objet Bestiau : 
$animal = Bestiau->engendrer; 

Constructeurs heritables 

Comme toutes les methodes, un constructeur n'est qu'une fonction, mais nous ne l'ap- 
pelons pas fonction. Nous l'invoquons toujours comme methode — ici une methode 
de classe, car l'invoquant est un nom de paquetage. Les invocations de methode diffe- 
rent des appels de fonctions normales de deux facons. Premierement, elles recoivent un 
parametre supplementaire, comme indique precedemment. Deuxiemement, elles 
obeissent a l'heritage, permettant ainsi a une classe d'utiliser les methodes d'une autre. 

Nous decrirons plus rigoureusement la mecanique sous-jacente de l'heritage dans la sec- 
tion suivante, mais pour l'instant, quelques exemples simples de ses effets devraient 
vous permettre de creer vos constructeurs. Par exemple, supposons que nous avons une 
classe Araignee qui herite des methodes de la classe Bestiau. En particulier, supposons 
que la classe Araignee ne possede pas sa propre methode engendrer. On obtient les cor- 
respondances suivantes : 



Appel de methode 


Appel de fonction resultant 


Bestiau- >engendrer() 
Araignee- >engendrer() 


Bestiau : : engendrer ( " Bestiau " ) . 
Bestiau: : engendrer ("Araignee"). 



La fonction appelee est la mime dans les deux cas, mais le parametre est different. Notez 
que notre constructeur engendrer ne pretait aucune attention a son parametre, ce qui 
signifie que notre objet Araignee etait incorrectement consacre avec la classe Bestiau. 
Un meilleur constructeur fournirait le nom du paquetage (passe comme premier para- 
metre) a bless : 

sub engendrer { 

my $classe = shift; # Enregistrer le nom de paquetage 
my $self = { }; 

bless($selfj $classe); # Consacrer la reference avec ce paquetage 
return $self; 

} 

Maintenant vous pourriez utiliser la mime fonction pour les deux cas : 

$vermine = Bestiau->engendrer; 
$shelob = Araignee->engendrer; 

Et chaque objet serait de la classe appropriee. Ceci fonctionne mime indirectement, 
comme par exemple : 

$type = "Araignee"; 

$shelob = $type->engendrer; # pareil que "Araignee"->engendrer 

Cela reste une methode de classe, pas une methode d'instance, parce que son invoquant 
contient une chaine et non une reference. 

Si $type etait un objet au lieu d'un nom de classe, la definition de constructeur ci-dessus 
ne fonctionnerait pas, car bless necessite un nom de classe. Mais pour beaucoup de clas- 
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ses, il est interessant d'utiliser un objet existant comme modele pour la creation d'un 
nouvel objet. Dans ces cas, vous pouvez definir vos constructeurs de facon a ce qu'ils 
fonctionnent a la fois avec des objets ou avec des noms de classe : 

sub engendrer { 

my $invoquant = shift; 

my $classe = ref ($invoquant) | | $invoquant; # Objet ou nom de classe 
my $self = { }; 
bless($self, $classe); 
return $self; 

} 

Initialiseurs 

La majorite des objets gerent des informations internes qui sont indirectement mani- 
pulees par les methodes de l'objet. Tous nos constructeurs jusqu'a maintenant ont cree 
des hachages vides, mais il n'y a pas de raison de les laisser vides. Par exemple, un cons- 
tructeur pourrait accepter des parametres supplementaires a ranger dans le hachage 
comme couples clef/valeur. Les livres OO appellent souvent de telles donnees proprietes, 
attributs, accesseurs, donne'es membres, donnees d'instance ou variables d'instance. La section 
Gestion des donnees d'instance plus loin dans ce chapitre donne plus de details sur les at- 
tributs. 

Imaginez une classe Cheval avec des attributs d'instance comme « nom » et 
« couleur » : 

$monture = Cheval->new(nom => "Grispoil", couleur => "blanc"); 

Si l'objet est implemente comme reference a un hachage, les couples clef/valeur peuvent 
etre interpoles directement dans le hachage une fois que l'invoquant est supprime de la 
liste des parametres : 

sub new { 

my $invoquant = shift; 

my $classe = ref ($invoquant) | | $invoquant; 

my $self = { @_ }; # Les parametres restants deviennent des attributs 
bless($self, $classe);# Transformer en objet 
return $self; 

} 

Cette fois-ci nous avons utilise une methode appelee new comme constructeur de la clas- 
se, ce qui pourrait bien donner aux programmeurs C++ l'impression de savoir ce qui se 
passe. Mais Perl ne considere pas « new » comme etant quelque chose de special ; vous 
pouvez nommer vos constructeurs comme vous voulez. Toute methode qui cree et re- 
tourne un objet est de fait un constructeur. En general, nous vous recommandons de 
donner a vos constructeurs des noms qui correspondent au contexte du probleme que 
vous resolvez. Par exemple, les constructeurs du module Tk ont le mime nom que le 
widget qu'ils creent. Dans le module DBI, un constructeur nomme connect retourne un 
objet handle de base de donnees, et un autre constructeur nomme prepare est invoque 
comme methode d'instance et retourne un objet handle de statement. Mais s'il n'y a pas 
de nom de constructeur qui convienne au contexte, new n'est peut-etre pas un mauvais 
choix. Cela dit, ce n'est peut-etre pas une si mauvaise chose de choisir au hasard un nom 
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pour obliger les gens a lire le contrat d'interface (c'est-a-dire la documentation de la clas- 
se) avant d'utiliser ses constructeurs. 

Vous pouvez aussi configurer votre constructeur avec des couples clef/valeur par defaut, 
que Putilisateur peut supplanter en les passant comme parametres : 

sub new { 

my $invoquant = shift; 

my $classe = ref ($invoquant) | | $invoquant; 
my $self = { 

couleur => "bai", 

pattes => 4, 

proprietaire => undef, 

|5)_, # Supplanter les attributs precedents 

}; 

return bless $self, $classe; 

} 

$ed = Cheval->new; # Un cheval bai a 4 pattes 

$etalon = Cheval->new(couleur => "noir"); # Un cheval noir a 4 pattes 

Ce constructeur de Cheval ne prete pas attention aux attributs existants de son invo- 
quant lorsqu'il est utilise comme methode d'instance. Vous pourriez creer un deuxieme 
constructeur concu pour etre appele comme methode d'instance, et s'il etait concu cor- 
rectement, vous pourriez utiliser les valeurs de l'objet invoquant comme valeurs par de- 
faut du nouvel objet : 

$monture = Cheval->new(couleur => "gris"); 

$poulain = $monture->clone(proprietaire => "EquuCen Guild, Ltd."); 

sub clone { 

my $modele = shift; 

my $self = $modele->new(%$modele, @_); 
return $self; # Deja consacre par ->new 

} 

(Vous auriez egalement pu integrer cette fonction directement dans new, mais alors le 
nom ne correspondrait plus tout a fait a son role.) 

Remarquez comment, meme dans le constructeur clone, nous ne codons pas en dur le 
nom de la classe Cheval. Ainsi l'objet d'origine invoque sa methode new, quelle qu'elle 
soit. Si nous avions ecrit cela Cheval- >new au lieu de $modele- >new, la classe n'aurait pas 
facilite l'heritage par une classe Zebre ou une classe Licorne. II serait dommage de do- 
ner Pegase et de se retrouver avec un vulgaire bidet. 

Cependant, parfois vous avez le probleme contraire : au lieu de partager un meme cons- 
tructeur entre plusieurs classes, vous essayez de faire partager l'objet d'une meme classe 
entre plusieurs constructeurs. Cela se passe a chaque fois qu'un constructeur veut appe- 
ler le constructeur d'une classe de base pour faire une partie du travail de construction. 
Perl ne fait pas de construction hierarchique a votre place. C'est-a-dire que Perl n'appelle 
pas automatiquement les constructeurs (ou les destructeurs) des classes de base de la 
classe en question, done votre constructeur devra faire cela lui-meme et ensuite rajouter 
tout autre attribut dont a besoin la classe derivee. Done la situation est similaire a la me- 
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thode clone, sauf qu'au lieu de copier un objet existant vers un nouvel objet, vous vou- 
lez appeler le constructeur de votre classe de base et ensuite transformer le nouvel objet 
de base en votre nouvel objet derive. 

Heritage de classe 

Comme pour le reste du systeme objet de Perl, l'heritage d'une classe par une autre ne 
necessite l'ajout au langage d'aucune syntaxe particuliere. Lorsque vous invoquez une 
methode pour laquelle Perl ne trouve pas de fonction dans le paquetage de l'invoquant, 
le tableau @ISA 5 de ce paquetage est examine. C'est ainsi que Perl implemente 
l'heritage : chaque element du tableau @ISA d'un paquetage donne contient le nom 
d'un autre paquetage, dans lequel est faite une recherche lorsque manquent des metho- 
des. Par exemple, ce qui suit fait de la classe Cheval une sous-classe de la classe Bestiau. 
(Nous declarons @ISA avec our parce qu'il doit etre une variable de paquetage, pas une 
variable lexicale declaree avec my.) 

package Cheval; 

our @ISA = "Bestiau"; 

Vous devriez maintenant pouvoir utiliser un objet ou une classe Cheval partout ou 
Bestiau etait utilise. Si votre classe reussit ce test de sous-classe vide, vous savez que Bes- 
tiau est une classe de base correcte, apte a l'heritage. 

Supposons que vous avez un objet Cheval dans $monture et que vous invoquez une me- 
thode deplacer dessus : 

$monture->deplacer(lO); 

Comme $monture est un Cheval, le premier choix de Perl pour cette methode est la 
fonction Cheval: : deplacer. S'il n'y en a pas, au lieu de lever une exception a l'execu- 
tion, Perl consulte d'abord le premier element du tableau @Cheval: :ISA, qui lui indi- 
que de chercher Bestiau: : deplacer dans le paquetage Bestiau. Si cette fonction n'est 
pas trouvee non plus, et que Bestiau a son propre tableau @Bestiau : : ISA, alors lui aussi 
sera consulte pour trouver le nom d'un paquetage ancestral qui puisse fournir une me- 
thode deplacer, et ainsi de suite en remontant la hierarchie d'heritage jusqu'a ce que 
l'on tombe sur un paquetage sans un @ISA. 

La situation que nous venons de decrire est Yheritage simple, dans lequel chaque classe 
n'a qu'un seul parent. Perl permet aussi Yheritage multiple : il suffit d'ajouter d'autres pa- 
quetages a F@ISA de la classe. Ce type d'heritage fonctionne davantage comme une struc- 
ture de donnees en arbre, car chaque paquetage peut avoir plus d'un parent immediat. 
Certaines personnes trouvent cela plus sexy. 

Lorsque vous invoquez une methode nom_meth sur un invoquant de type nom_classe, 
Perl essaie six facons differentes de trouver une fonction a utiliser : 

1. D'abord, Perl cherche une fonction nommee nom_classe: :nom_meth dans le 
paquetage de l'invoquant. Si cela echoue, l'heritage entre en jeu, et nous passons a 
la deuxieme etape. 



5. Se prononce « is a » (« est un ») en anglais, comme « A horse is a critter. » (« Un cheval est 
un bestiau. ») 
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2. Ensuite, Perl cherche une methode heritee de classes de base en cherchant dans 
tous les paquetages parent listes dans @nom_classe: :ISA une fonction par- 
ent: :nom_meth. La recherche se fait de gauche a droite, recursivement, et en cher- 
chant en profondeur d'abord (depth-first). La recursivite garantit que Ton 
recherche dans les classes grand-parent, arriere-grand-parent, arriere-arriere-grand- 
parent et ainsi de suite. 

3. Si cela echoue, Perl cherche une fonction nommee UNIVERSAL : : nom_meth. 

4. A ce stade, Perl abandonne nom_meth et commence a chercher un AUTOLOAD. 
D'abord, il cherche une fonction nommee nom_classe: : AUTOLOAD. 

5. S'il n'en trouve pas, Perl cherche dans toutes les classes parent listees dans 
@nom_classe : : ISA une fonction parent : : AUTOLOAD . La recherche est a nouveau de 
gauche a droite, recursive, et en profondeur d'abord. 

6. Pour finir, Perl cherche une fonction nommee UNIVERSAL : : AUTOLOAD. 

Perl s'arrete a la premiere tentative reussie et invoque cette fonction. Si aucune fonction 
n'est trouvee, une exception est levee, que vous verrez frequemment : 

Can't locate object method "nomjneth" via package "nom_classe" 

Si vous avez compile une version Perl de debogage avec l'option -DDEBUCCINC de votre 
compilateur C, en utilisant l'option -Do de Perl, vous pouvez le regarder passer par cha- 
cune de ces etapes lorsqu'il resout une invocation de methode. 

Nous detaillerons le mecanisme d'heritage au fur et a mesure dans ce qui suit. 

Heritage avec @ISA 

Si @ISA contient plusieurs noms de paquetage, les paquetages sont tous parcourus de 
gauche a droite. La recherche se fait en profondeur d'abord, done si vous avez une classe 
Mule configured pour l'heritage de la facon suivante : 

package Mule; 

our @ISA = ("Cheval", "Ane"); 

Perl cherche les methodes manquantes de Mule d'abord dans Cheval (et dans tous ses 
ancetres, comme Bestiau) avant de continuer a chercher dans Ane et ses ancetres. 

Si une methode manquante est trouvee dans la classe de base, pour plus d'efficacite, Perl 
place cet emplacement en interne dans un cache dans la classe courante, pour qu'il n'ait 
pas a chercher aussi loin la prochaine fois qu'il doit trouver cette methode. Modifier 
@ISA ou definir de nouvelles methodes invalide le cache et oblige Perl a faire la recher- 
che de nouveau. 

Lorsque Perl cherche une methode, il s'assure que vous n'avez pas cree de hierarchie 
d'heritage circulaire. Ceci pourrait se produire si deux classes heritaient l'une de l'autre, 
meme indirectement par d'autres classes. Essayer d'etre votre propre grand-pere est trop 
paradoxal, meme pour Perl, done la tentative leve une exception. Toutefois, Perl ne con- 
sidere pas comme une erreur d'heriter de plusieurs classes partageant de memes ance- 
tres, ce qui fait penser a un mariage entre cousins. Simplement, votre hierarchie 
d'heritage ne ressemble plus a un arbre et commence a ressembler a un graphe acycli- 
que oriente. Ceci ne derange pas Perl — tant que le graphe est reellement acyclique. 
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Lorsque vous initialisez @ISA, l'affectation se produit normalement a l'execution, done 
sauf si vous prenez des precautions, le code dans un bloc BEGIN, CHECK ou INIT ne pourra 
pas utiliser la hierarchie d'heritage. Le pragma use base est une precaution (ou com- 
modity) qui vous permet d'utiliser des classes avec require et les ajoute a @ISA a la com- 
pilation. Voici comment vous pourriez l'utiliser : 

package Mule; 

use base ("Cheval", "Ane"); # declarer les surclasses 

Ceci est un raccourci de : 

package Mule; 
BEGIN { 

our @ISA = ("Cheval", "Ane"); 
require Cheval; 
require Ane; 

} 

sauf que use base prend aussi en compte toute declaration use fields. 

II arrive que les gens s'etonnent que Finclusion d'une classe dans @ISA n'effectue pas le 
require correspondant a votre place. C'est parce que le systeme de classes de Perl est lar- 
gement separe du systeme de modules. Un fichier peut contenir plusieurs classes (puis- 
qu'elles ne sont que des paquetages), et un paquetage peut etre mentionne dans 
plusieurs fichiers. Mais dans la situation la plus courante, dans laquelle un paquetage et 
une classe et un module et un fichier deviennent assez interchangeables si vous plissez 
suffisamment les yeux, le pragma use base fournit une syntaxe declarative qui etablit 
l'heritage, charge les fichiers de module, et gere les declarations de champs de classe de 
base. C'est une de ces diagonales commodes que nous mentionnons souvent. 

Voir pour plus de details les descriptions de use base et de use fields au chapitre 31. 

Acces aux methodes supplantees 

Lorsqu'une classe definit une methode, cette fonction supplante les methodes de meme 
nom dans toutes les classes de base. Imaginons que vous avez un objet Mule (derive de 
la classe Cheval et de la classe Ane), et que vous decidez d'invoquer la methode procreer 
de votre objet. Bien que les classes parentes aient leur propres methodes procreer, le 
concepteur de la classe Mule les a supplantees en fournissant a la classe Mule sa propre 
methode procreer. Cela veut dire que le croisement suivant risque de ne pas etre pro- 
ductif : 

$etalon = Cheval->new(sexe => "male"); 
$molly = Mule->new(sexe => "femelle"); 
$poulain = $molly->procreer($etalon); 

Supposons maintenant que par le miracle de l'ingenierie genetique, vous trouvez un 
moyen de contourner le probleme bien connu de sterilite de la mule, done vous souhai- 
tez passer outre la methode Mule : : procreer non viable. Vous pourriez appeler votre me- 
thode comme une fonction ordinaire, en s'assurant de passer explicitement 
Finvoquant : 

$poulain = Cheval: : procreer ($molly, $etalon); 

Toutefois ceci contourne l'heritage, ce qui est presque toujours la mauvaise chose a faire. 
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II est parfaitement imaginable que la fonction Cheval : : procreer n'existe pas, car Chev- 
al et Ane derivent ce comportement d'un parent commun nomme Equide. Si, d'un 
autre cote, vous voulez que Perl commence a chercher une methode dans une classe don- 
nee, utilisez simplement l'invocation de methode ordinaire, mais qualifiez le nom de 
methode avec la classe : 

$poulain = $molly->Cheval: : procreer ($etalon); 

Parfois vous voudrez qu'une methode dans une classe derivee serve d'emballage pour 
une methode dans une classe de base. La methode de la classe derivee peut elle-meme 
appeler la methode dans la classe de base, ajoutant ses propres actions avant ou apres 
cette invocation. Vous pourriez utiliser la notation ci-dessus pour specifier dans quelle 
classe commencer la recherche. Mais dans la plupart des cas de methodes supplantees, 
vous voudrez probablement eviter de savoir ou de specifier quelle classe parente appar- 
tient a la methode supplantee que vous voulez executer. 

C'est la que la pseudo-classe SUPER est tres utile. Elle vous permet d'invoquer une me- 
thode supplantee de classe de base sans avoir a specifier quelle classe a defini cette me- 
thode. 6 La fonction suivante consulte le tableau @ISA du paquetage courant sans vous 
faire specifier de nom de classe : 

package Mule; 

our @ISA = qw(Cheval Ane); 
sub coupdepied { 
my $self = shift; 

print "La mule donne un coup de pied !\n"; 
$self ->SUPER : : coup_de_pied (@_) ; 

} 

Le pseudo-paquetage n'a un sens que lorsqu'il est utilise a I'interieur d'une methode. 
Bien que celui qui implemente une classe peut faire usage de SUPER dans son propre co- 
de, quelqu'un qui ne fait qu'utiliser les objets de la classe ne le peut pas. 

SUPER ne fonctionne pas toujours comme vous le voudriez dans le cas d'un heritage 
multiple. Comme vous pourriez vous y attendre, il parcourt @ISA exactement comme le 
fait le mecanisme d'heritage normal : de gauche a droite, recursivement, et en profon- 
deur d'abord. Si Cheval et Ane avaient chacun une methode dire, et que vous preferiez 
la methode d'Ane, vous auriez a nommer explicitement la classe parente : 

sub dire { 

my $self = shift; 

print "La mule parle !\n"; 

$self->Ane: :dire(@_); 

} 

Des manieres plus elaborees de traiter les situations avec heritage multiple peuvent etre 
creees avec la methode UNIVERSAL: :can decrite dans la section suivante. Vous pouvez 
aussi recuperer le module Class : :Multimethods de CPAN, qui fournit de nombreuses 



6. Ceci n'est pas a confondre avec le mecanisme mentionne au chapitre 11 pour supplanter les 
fonctions internes de Perl, qui ne sont pas des methodes d'objet et ne sont done pas supplantees 
par heritage. Vous appelez les fonctions internes supplantees avec le pseudo-paquetage CORE, pas 
le pseudo-paquetage SUPER. 



Heritage de classe 



299 



solutions sophistiquees, dont une qui trouve la methode la plus proche au lieu de celle 
situee le plus a gauche. 

Chaque bout de code Perl sait dans quel paquetage il se trouve, d'apres la derniere ins- 
truction package. Une methode SUPER ne consulte le @ISA que du paquetage dans lequel 
l'appel a SUPER a ete compile. II ne se soucie pas de la classe de l'invoquant, ni du paque- 
tage de la fonction appelee. Ceci peut causer des problemes si vous tentez de definir des 
methodes dans une autre classe simplement en jouant sur le nom de methode : 

package Oiseau; 
use Libellule; 

sub Libellule: :bombarder { shift->SUPER: :bombarder(|5)_) } 

Malheureusement, ceci invoque la surclasse d'Oiseau, pas celle de Libellule. Pour faire 
ce que vous essayez de faire, vous devez aussi explicitement passer dans le paquetage ap- 
proprie pour la compilation de SUPER : 

package Oiseau; 
use Libellule; 
{ 

package Libellule; 

sub bombarder { shift->SUPER: :bombarder(@_) } 

} 

Comme l'indique cet exemple, il n'est jamais necessaire de modifier un fichier de mo- 
dule pour simplement ajouter des methodes a une classe existante. Puisqu'une classe 
n'est qu'un paquetage, et qu'une methode n'est qu'une fonction, tout ce que vous devez 
faire c'est definir une fonction dans ce paquetage comme nous l'avons fait ici, et la classe 
possede soudainement une nouvelle methode. L'heritage n'est pas necessaire. Seul 
compte le paquetage, et comme les paquetages sont globaux, on peut acceder a tout pa- 
quetage de n'importe oil dans le programme. (Vous a-t-on informe que nous allions ins- 
taller une baignoire dans votre salon la semaine prochaine ?) 

UNIVERSAL : la classe ancetre ultime 

Si aucune definition de methode de nom correspondant n'est trouvee apres avoir re- 
cherche dans la classe de l'invoquant et recursivement dans toutes ses classes ancetres, 
une derniere recherche de methode de ce nom est faite dans la classe speciale predefinie 
nommee UNIVERSAL. Ce paquetage n'apparait jamais dans un @ISA, mais il est toujours 
consulte lorsque la recherche dans @ISA echoue. Vous pouvez voir UNIVERSAL comme 
l'ancetre ultime dont derivent implicitement toutes les classes. 

Les methodes predefinies suivantes sont disponibles dans la classe UNIVERSAL, et done 
dans toutes les classes. Elles fonctionnent toutes qu'elles soient invoquees comme me- 
thodes de classe ou comme methodes d'objet. 

INV00UANT->isa (CLASSE) 

La methode isa retourne vrai si la classe d'INVOOUANT est CLASSE ou une classe heri- 
tant de CLASSE. A la place d'un nom de paquetage, CLASSE peut aussi etre un des 
types internes, comme « HASH » ou « ARRAY ». (Mais la determination du type exact 
n'est pas bon signe pour l'encapsulation et le polymorphisme. Vous devriez depen- 
dre de l'acheminement de methode pour vous donner la bonne methode.) 
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use FileHandle; 

if (FileHandle->isa("Exporter")) { 

print "FileHandle est un Exporter. \n"; 

} 

$fh = FileHandle->new(); 

if ($fh->isa("IO::Handle")) { 

print "\$fh est un objet en rapport avec 10. \n"; 

} 

if ($fh->isa("GL0B")) { 

print "\$fh est en fait une reference a un GLOB.Nn"; 

} 

INV00UANT- >can (METHODE) 

La methode can retourne une reference a la fonction qui serait appelee si METHODE 
etait appliquee a INV00UANT. Si une telle fonction n'est pas trouvee, can retourne 
undef. 

if ($invoquant->can("copier")) { 

print "Notre invoquant peut copier. \n"; 

} 

Ceci pourrait etre utilise pour n'invoquer une methode que si elle existe : 

$obj->grogner if $obj->can("grogner"); 
Avec l'heritage multiple, ceci permet a une methode d'invoquer toutes les metho- 
des de classe de base supplantees, et non pas seulement celle la plus a gauche : 
sub grogner { 

my $self = shift; 

print "Grognement: @_\n"; 

my %vues; 

for my $parent (@ISA) { 

if (my $code = $parent->can("grogner")) { 
$self->$code(@_) unless $vues{$code}++; 

} 

} 

} 

Nous utilisons le hachage %vues pour nous souvenir des fonctions deja appelees. 
Ceci pourrait se produire si plusieurs classes parentes avaient un ancetre commun. 
Les methodes qui declencheraient un AUTOLOAD (decrit dans la section suivante) ne 
seront pas correctement signalees sauf si le paquetage a declare (mais pas defini) les 
fonctions qu'il souhaite voir autocharger. 

INV00UANT->\IERSI0H(RE0UIS) 

La methode VERSION retourne le numero de version de la classe d' INVOQUANT, tel 
qu'il a ete enregistre dans la variable $VERSI0N du paquetage. Si le parametre REQ- 
UIS est fourni, elle verifie que la version courante n'est pas plus petite que REQUIS, 
et leve une exception si elle Test. C'est la methode qu'invoque use pour determiner 
si un module est suffisamment recent. 

use Thread 1.0; # appelle Thread->VERSI0N(1.0) 

print "Execute la version ", Thread->VERSION, " de Thread. \n"; 
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Vous pouvez fournir votre propre methode VERSION pour supplanter la methode 
dans UNIVERSAL. Neanmoins, ceci obligera aussi toute classe derivee de votre classe 
a utiliser la methode supplantee. Si vous ne souhaitez pas que cela se produise, 
vous devriez concevoir votre methode de telle sorte qu'elle delegue a UNIVERSAL les 
requetes de version des autres classes. 

Les methodes dans UNIVERSAL sont des fonctions internes de Perl, que vous pouvez ap- 
peler si vous les qualifiez et leur passez deux parametres, comme dans UNIVER- 
SAL: :isa($obj_form, "HASH"). (Mais ceci n'est pas vraiment conseille puisque can a 
normalement la reponse que vous cherchez vraiment.) 

Vous etes libre d'ajouter vos propres methodes a la classe UNIVERSAL. (Vous devez etre 
tres prudent, evidemment ; vous pourriez vraiment gacher les choses pour quelqu'un 
qui s'attend a ne pas trouver le nom de methode que vous definissez, peut-etre pour 
qu'il puisse l'autocharger d'un autre endroit.) Ici nous creons une methode copier que 
les objets d'une classe quelconque peuvent utiliser s'ils ne l'ont pas defmie eux-memes. 
(Elle echoue de facon spectaculaire si elle est invoquee pour une classe au lieu d'un ob- 
jet.) 

use Data: : Dumper; 
use Carp; 

sub UNIVERSAL: : copier { 
my $self = shift; 
if (ref $self) { 

return eval Dumper($self ); # pas de ref de CODE 
} else { 

confess "UNIVERSAL: : copier ne peut pas copier la classe $self"; 

} 

} 

Cette utilisation de Data : : Dumper ne fonctionne pas si l'objet contient des references 
aux fonctions, car elle ne peuvent pas etre reproduites correctement. Meme si le source 
etait disponible, les liens lexicaux seraient perdus. 

Autochargement de methode 

Normalement, lorsque vous appelez une fonction non definie dans un paquetage qui 
definit une fonction AUTOLOAD, la fonction AUTOLOAD est appelee au lieu de lever une ex- 
ception (voir la section Autochargement au chapitre 10). Avec les methodes, ceci fonc- 
tionne un peu differemment. Si la recherche de methode normale (dans la classe, dans 
ses ancetres, et finalement dans UNIVERSAL) echoue, la meme sequence est de nouveau 
executee, en cherchant cette fois une fonction AUTOLOAD. Si elle est trouvee, cette fonc- 
tion est appelee comme methode, en affectant a la variable $ AUTO LOAD du paquetage le 
nom complet de la fonction au nom de laquelle a ete appele AUTOLOAD. 

Vous devez etre un peu prudent lorsque vous autochargez des methodes. Premiere- 
ment, la fonction AUTOLOAD doit retourner immediatement si elle est appelee au nom 
d'une methode nominee DESTROY, sauf si votre but etait de simuler DESTROY, qui en Perl 
a une signification speciale decrite dans la section Destructeurs d'instance plus loin dans 
ce chapitre. 
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sub AUTOLOAD { 

return if our $ AUTO LOAD =~ /: :DESTROY$/; 

} 

Deuxiemement, si une classe foumit un filet de surete AUTOLOAD, vous ne pourrez pas 
utiliser UNIVERSAL: :can sur un nom de methode pour verifier si Ton peut l'invoquer. 
Vous devez verifier AUTOLOAD separement : 

if ($obj->can("nom_meth") | | $obj->can("AUT0L0AD")) { 
$obj->nom_meth(); 

} 

Finalement, avec l'heritage multiple, si une classe herite de deux classes ou plus, chacu- 
ne ayant un AUTOLOAD, seul celui le plus a gauche sera jamais declenche, puisque Perl 
s'arrete des qu'il trouve le premier AUTOLOAD. 

Ces deux dernieres tracasseries sont facilement contournees en declarant les fonctions 
dans le paquetage dont le AUTOLOAD est cense gerer ces methodes. Vous pouvez faire ceci, 
soit avec des declarations individuelles : 

package Goblin; 
sub taper; 
sub mordre; 
sub griffer; 

soit avec le pragma use subs, qui est plus commode si vous avez de nombreuses metho- 
des a declarer : 

package Goblin; 

use subs qw(taper mordre griffer); 

Meme si vous n'avez que declare ces fonctions sans les definir, c'est assez pour que le sys- 
teme pense qu'elles sont reelles. Elles apparaissent dans la verification avec UNIVER- 
SAL: :can, et plus important encore, elles apparaissent dans l'etape 2 de recherche de 
methode, qui n'ira jamais jusqu'a l'etape 3 et encore moins la 4. 

« Mais, mais, » vous vous exclamez, « elles invoquent AUTOLOAD, non ? » Eh bien oui, 
elles finissent par le faire, mais le mecanisme est different. Ayant trouve le bout de me- 
thode grace a l'etape 2, Perl essaie de l'appeler. Lorsqu'il decouvre que la methode n'est 
pas tout ce qu'elle aurait pu etre, la recherche de methode AUTOLOAD demarre de nou- 
veau, mais cette fois-ci, elle demarre dans la classe contenant le bout de methode, ce qui 
restreint la recherche de methode a la classe et a ses ancetres (et a UNIVERSAL). Voila 
comment Perl trouve le bon AUTOLOAD a executer et ignore les AUTOLOAD de la mauvaise 
partie de l'arbre genealogique. 

Methodes privees 

II existe un moyen d'invoquer une methode de telle facon que Perl ignore complete- 
ment l'heritage. Si au lieu d'utiliser un nom de methode litteral, vous specifiez une sim- 
ple variable scalaire contenant une reference a la fonction, alors la fonction est appelee 
immediatement. Dans la precedente description de UNIVERSAL- >can, le dernier exem- 
ple invoque toutes les methodes supplantees en utilisant la reference a la fonction, pas 
son nom. 
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Un aspect intrigant de ce comportement est qu'il peut etre utilise pour implementer des 
appels de methode privee. Si vous mettez la classe dans un module, vous pouvez utiliser 
la portee lexicale du fichier pour faire un espace prive. Premierement, stockez une fonc- 
tion anonyme dans une variable lexicale dont la portee est le fichier : 

# declarer une methode privee 
my $porte_secrete = sub { 
my $self = shift; 



}; 

Plus loin dans ce fichier, vous pouvez utiliser la variable comme si elle contenait un 
nom de variable. La fermeture sera appelee directement, sans prendre l'heritage en con- 
sideration. Comme pour toute autre methode, l'invoquant est passe en parametre sup- 
plementaire. 

sub frapper { 

my $self = shift; 
if ($self->{frappe}++ > 5) { 
$self->$porte_secrete(); 

} 

} 

Ceci permet aux fonctions appartenant a un fichier (les methodes de classe) d'invoquer 
une methode a laquelle tout code hors de leur portee lexicale ne peut acceder. 
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Comme pour tout autre referent en Perl, lorsque la derniere reference a un objet dispa- 
rait, sa memoire est implicitement recyclee. Avec un objet, vous avez la possibilite de 
prendre la main juste au moment ou ceci est pres de se passer en definissant une fonc- 
tion DESTROY dans le paquetage de la classe. Cette methode est declenchee automatique- 
ment au moment approprie, avec l'objet pret a etre recycle comme unique parametre. 

Les destructeurs sont rarement necessaires en Perl, parce que la memoire est geree auto- 
matiquement pour vous. Cependant, la memoire mise a part, certains objets peuvent 
avoir des informations d'etat dont vous pouvez souhaiter vous occuper, comme des han- 
dles de fichier ou des connexions a une base de donnees. 

package Notif ierCourrier; 
sub DESTROY { 

my $self = shift; 

my $fh = $self->{handle_courrier}; 
my $id = $self->{nom}; 

print $fh "\n$id s'en va a " . localtimeQ . "\n"; 
close $fh; # fermer la connexion au systeme de courrier 

} 

De meme que Perl n'utilise qu'une unique methode pour construire un objet mime 
lorsque la classe du constructeur herite d'une ou plusieurs autres classes, Perl n'utilise 
aussi qu'une unique methode DESTROY par objet detruit quel que soit l'heritage. En 
d'autres termes, Perl ne fait pas de la destruction hierarchique a votre place. Si votre clas- 
se supplante le destructeur d'une surclasse, alors votre methode DESTROY devra peut-etre 
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invoquer la methode DESTROY d'une classe de base : 

sub DESTROY { 

my $self = shift; 

# voir s'il y a un destructeur supplante... 
$self->SUPER::DESTROY if $self->can("SUPER: : DESTROY"); 

# faites vos choses maintenant, avant ou apres 

} 

Ceci ne s'applique qu'aux classes heritees ; un objet qui est simplement contenu dans 
l'objet courant — comme, par exemple, une valeur dans un hachage — sera libere et de- 
truit automatiquement. C'est une raison pour laquelle l'appartenance par simple agre- 
gation (parfois appelee relation « has-a » ou « possede-un ») est souvent plus propre et 
plus claire que l'heritage (une relation « est-un »). En d'autres termes, il suffit parfois 
de stocker un objet directement a l'interieur d'un autre au lieu d'employer l'heritage, 
qui peut inutilement ajouter de la complexite. Parfois lorsque des utilisateurs se tour- 
nent vers l'heritage multiple, l'heritage simple peut suffire. 

Il est possible, mais rarement necessaire, d'appeler DESTROY explicitement. Cela peut 
meme etre dangereux car l'execution du destructeur plus d'une fois sur un meme objet 
pourrait s'averer desagreable. 

Ramasse-miettes avec les methodes DESTROY 

Comme nous l'avons decrit dans la section Ramasse-miettes, references circulaires et refe- 
rences faibles du chapitre 8, une variable qui fait reference a elle-meme n'est liberee que 
quand le programme (ou l'interpreteur integre) est sur le point de se terminer (il en est 
de meme pour plusieurs variables qui se font reference indirectement entre elles). Si 
vous voulez recuperer la memoire plus tot, vous devez normalement annuler explicite- 
ment la reference ou l'affaiblir avec le module WeakRef de CPAN. 

Avec les objets, une autre solution est de creer une classe conteneur qui contient un 
pointeur a la structure de donnees autoreferentielle. Definissez une methode DESTROY 
pour la classe de l'objet conteneur qui annule manuellement les boucles dans la struc- 
ture autoreferentielle. Vous trouverez un exemple de ceci dans le chapitre 13 du Perl en 
action dans la recette 13.13, Gerer les structures de donnees circulaires. 

Lorsqu'un interpreteur se termine, tous ses objets sont detruits, ce qui est important 
pour les applications Perl multi-threadees ou integres dans un autre logiciel. Les objets 
sont presque toujours detruits lors d'une etape distincte, avant les references ordinaires. 
Ceci afin d'empecher les methodes DESTROY d'utiliser des references qui ont elles-memes 
ete detruites. (Et aussi parce que les references ordinaires ne sont soumises au ramasse- 
miettes que dans les interpreteurs integres, puisque terminer un processus est une facon 
tres rapide de recuperer les references. Mais terminer n'executera pas les destructeurs 
d'objet, done Perl le fait d'abord.) 

Gestion des donnees d'instance 

La plupart des classes creent des objets qui ne sont essentiellement que des structures 
de donnees avec plusieurs champs de donnees internes (ou variables d'instance) avec 
des methodes pour les manipuler. 
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Les classes Perl heritent de methodes, pas de donnees, mais tant que tout acces a l'objet 
se fait par des appels de methode, tout se passe tres bien. Si vous voulez l'heritage de 
donnees, vous devez le realiser par l'heritage de methodes. Generalement, ceci n'est pas 
necessaire en Perl, car la plupart des classes stockent les attributs de leur objet dans un 
hachage anonyme. Les donnees d'instance de l'objet sont contenues dans ce hachage, 
qui constitue son propre petit espace de noms dans lequel peut tailler toute classe fai- 
sant quelque chose avec l'objet. Par exemple, si vous voulez qu'un objet appele $ville 
possede un champ nomme altitude, vous pouvez y acceder simplement avec $ville- 
>{altitude}. Aucune declaration n'est necessaire. Mais les methodes d'emballage ont 
leur utilite. 

Supposons que vous voulez implementer un objet Personne. Vous decidez d'avoir un 
champ appele « nom », que par curieuse coincidence vous stockez sous la clef nom dans 
le hachage anonyme qui servira d'objet. Pour profiter de Fencapsulation, les utilisateurs 
necessitent des methodes qui permettent d'acceder a cette variable d'instance sans lever 
le voile de l'abstraction. 

Par exemple, vous pourriez creer une paire d'accesseurs : 

sub recuperernom { 
my $self = shift; 
return $self->{nom}; 

} 

sub affecter_nom { 

my $self = shift; 
$self->{nom} = shift; 

} 

ce qui permet le code suivant : 

$lui = Person->new(); 
$lui->affecter_nom("Frodon"); 

$lui->affecter _nom( ucf irst($lui->recuperer nom) ); 

Vous pourriez meme combiner les deux methodes : 

sub nom { 

my $self = shift; 

if (@_) { $self->{nom} = shift } 

return $self->{nom}; 

} 

Ce qui permettrait le code suivant : 

$lui = Person->new(); 

$lui->nom("Frodon"); 

$lui->nom( ucf irst($lui->nom) ); 

L'avantage d'ecrire une fonction differente pour chaque variable d'instance (qui pour 
notre classe Personne pourrait etre nom, age, taille et ainsi de suite) est d'etre direct, evi- 
dent et flexible. Le desavantage est que chaque fois que vous voulez une nouvelle classe, 
vous finissez par definir une ou deux methodes identiques par variable d'instance. Au 
debut, ceci n'est pas genant, et vous etes libre de le faire si vous le souhaitez. Mais si vous 
preferez la commodite a la f lexibilite, vous prefererez peut-etre une des techniques de- 
crites dans les sections suivantes. 
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Notez que nous ferons varier l'implementation et non l'interface. Si les utilisateurs de 
votre classe respectent Fencapsulation, vous pourrez passer de maniere transparente 
d'une implementation a l'autre sans que les utilisateurs le remarquent. (Les membres 
de la famille de votre arbre d'heritage ne seront peut-etre pas aussi tolerants, puisqu'ils 
vous connaissent beaucoup mieux que ne vous connaissent des etrangers.) Si vos utili- 
sateurs ont pris l'habitude de mettre leur nez ou leurs mains dans les affaires privees de 
votre classe, le desastre inevitable est de leur faute et ne vous concerne pas. Tout ce que 
vous pouvez faire c'est respecter votre partie du contrat en gardant la meme interface. 
Essayer d'obliger tout le monde a ne jamais rien faire de mal prendra tout votre temps 
et toute votre energie — et en fin de compte echouera de toute facon. 

II est plus difficile de s'occuper des membres de la famille. Si une sous-classe supplante 
l'accesseur d'attribut d'une surclasse, doit-elle ou non acceder au meme champ dans le 
hachage ? Les deux approches sont defendables, selon la nature de l'attribut. Pour etre 
plus sur dans le cas general, chaque accesseur peut prefixer le nom de champ de hachage 
avec son propre nom de classe, de telle facon que la sous-classe et la surclasse puissent 
chacune avoir leur propre version. Plusieurs des exemples ci-dessous, dont le module 
Class: : Struct, utilisent cette strategic « resistante aux sous-classes ». Vous verrez des 
accesseurs qui ressemblent a ceci : 

sub nom { 

my $self = shift; 

my $champ = PACKAGE . "::nom"; 

if (@_) { $self->{$champ} = shift } 
return $self->{$champ}; 

} 

Dans chacun des exemples suivants, nous creons une classe Personne simple avec les 
champs nom, race, et surnoms, chacun avec une interface identique mais une implemen- 
tation completement differente. Nous n'allons pas vous dire laquelle nous preferons, car 
nous les preferons toutes, selon l'occasion. Et tous les gouts sont dans la nature. Certains 
preferent le ragout de lapin, d'autres le poisson. 

Declarations de champ avec use fields 

Un objet n'est pas obligatoirement implements avec un hachage anonyme. N'importe 
quelle reference suffira. Par exemple, si vous utilisiez un tableau anonyme, vous pour- 
riez definir un constructeur comme ceci : 

sub new { 

my $invoquant = shift; 

my $classe = ref ($invoquant) | | $invoquant; 
return bless [], $classe; 

} 

et des accesseurs comme ceci : 

sub nom { 

my $self = shift; 

if (<a>_) { $self->[0] = shift } 

return $self->[0]; 

} 
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sub race { 

my $self = shift; 

if (<a>_) { $self->[i] = shift } 

return $self->[l]; 

} 

sub surnoms { 

my $self = shift; 

if (@_) { $self->[2] = shift } 

return $self->[2]; 

} 

Les tableaux sont un peu plus rapides d'acces que les hachages et occupent un peu 
moins de memoire, mais ils ne sont pas terriblement commodes a utiliser. Vous devez 
tenir compte des numeros d'index (pas juste dans votre classe, mais aussi dans votre sur- 
classe), qui doivent d'une facon ou d'un autre indiquer quelles parties du tableau utilise 
votre classe. Sinon, vous pourriez reutiliser une case. 

Le pragma use fields traite tous ces points : 

package Personne; 

use fields qw(nom race surnoms); 

Ce pragma ne vous cree pas les methodes accesseurs, mais il depend de magie interne 
(appelee pseudo-hachages) pour faire quelque chose de similaire. (Vous souhaiterez peut- 
etre tout de meme emballer les champs dans des accesseurs, comme nous le faisons dans 
l'exemple suivant.) Les pseudo-hachages sont des references de tableau que vous pouvez 
utiliser comme des hachages parce qu'ils sont associes avec un tableau qui met les clefs 
en correspondance avec les index. Le pragma use fields vous met en place cette table 
de correspondance, declarant effectivement quels champs sont valides pour Fobjet 
Personne ; ceci les fait prendre en compte par le compilateur Perl. Si vous declarez le 
type de votre variable objet (comme avec my Personne $self dans l'exemple suivant), 
le compilateur est suffisamment intelligent pour optimiser Faeces aux champs avec des 
simples acces par tableau. De facon peut-etre plus importante, il fait a la compilation de 
la validation de type pour les noms de champ (e'est en quelque sorte une validation de 
typographic contre les fautes de frappe). (Voir la section Pseudo-hachages au chapitre 8.) 

Un constructeur et des exemples d'accesseurs ressembleraient a ceci : 

package Personne; 

use fields qw(nom race surnoms); 

sub new { 

my $type = shift; 

my Personne $self = fields: :new(ref $type || $type); 
$self->{nom} = "pas de nom"; 
$self->{race} = "inconnue"; 
$self->{surnoms} = []; 
return $self; 

} 

sub nom { 

my Personne $self = shift; 
$self->{nom} = shift if @_; 
return $self->{nom}; 

} 
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sub 



race { 

my Personne $self = shift; 
$self->{race} = shift if @_; 
return $self->{race}; 



} 



sub 



surnoms { 

my Personne $self = shift; 
$self->{surnoms} = shift if @_; 
return $self->{surnoms}; 



Si vous ecrivez incorrectement l'une des clefs litterales utilisees pour acceder au pseudo- 
hachage, vous n'aurez pas a attendre l'execution pour vous en rendre compte. Le com- 
pilateur sait a quel type $self est cense faire reference (parce que vous le lui avez dit), 
done il peut verifier que le code n'accede qu'a des champs reellement existants dans les 
objets Personne. S'il arrive que vos doigts s'emballent et que vous tentez d'acceder a un 
champ inexistant (comme $self ->{mon}), le compilateur peut tout de suite signaler cet- 
te erreur et ne laissera jamais executer par Finterpreteur le programme errone. 

II reste un peu de redite dans la declaration de methodes pour acceder aux variables 
d'instance, done vous souhaiterez peut-etre encore automatiser la creation de methodes 
accesseur simples avec l'une des techniques ci-dessous. Toutefois, comme ces techniques 
utilisent toutes une forme d'indirection ou une autre, vous perdrez l'avantage de la ve- 
rification a la compilation de fautes de frappe pour les acces types lexicalement aux ha- 
chages. II vous restera neanmoins les (legeres) economies de temps et d'espace. 

Si vous decidez d'utiliser un pseudo-hachage pour implementer votre classe, toute clas- 
se qui en herite doit prendre en compte cette implementation sous-jacente. Si un objet 
est implements avec un pseudo-hachage, tous les membres de la hierarchie d'heritage 
doivent utiliser les declarations use base et use fields. Par exemple : 

package Magicien; 

use base "Personne"; 

use fields qw(baton couleur sphere); 

Ceci fait du module Magicien une sous-classe de la classe Personne, et charge le fichier 
Personne.pm. Ceci declare egalement trois nouveaux champs dans cette classe, qui s'ajou- 
tent a ceux de Personne. Ainsi lorsque vous ecrirez : 

my Magicien $mage = fields: :new("Magicien"); 

vous aurez un objet pseudo-hachage avec acces aux champs des deux classes : 

$mage->nom("Gandalf "); 
$mage->couleur("Gris"); 

Puisque toutes les sous-classes doivent savoir qu'elles utilisent une implementation de 
pseudo-hachage, elles doivent utiliser la notation directe de pseudo-hachage pour des 
raisons d'efficacite et de validation des types : 

$mage->{nom} = "Gandalf"; 
$mage->{couleur} = "Gris"; 

Toutefois, si vous voulez garder des implementations interchangeables, les utilisateurs 
exterieurs de votre classe doivent utiliser les methodes accesseurs. 
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Bien que use base ne permette que l'heritage simple, ceci est rarement une contrainte 
severe. Voir les descriptions de use base et de use fields au chapitre 31. 

Generation de classes avec ClassrStruct 

Le module standard Class : : Struct exporte une fonction appelee struct. Celle-ci cree 
tout ce qu'il vous faut pour commencer l'ecriture d'une classe entiere. Elle genere un 
constructeur appele new, ainsi que des methodes accesseurs pour chacun des champs 
(variables d'instance) nommes dans cette structure. 

Par exemple, si vous mettez la classe dans un fichier Personne.pm : 

package Personne; 
use Class: :Struct; 

struct Personne => { # creer la definition d'une "Personne" 
nom => # le champ nom est un scalaire 

race => '$', # le champ race est aussi un scalaire 
surnoms => # mais le champ surnoms est une ref de tableau 

}; 
i; 

Alors vous pourriez utiliser le module de cette facon : 
use Personne; 

my $mage = Personne->new(); 
$mage->nom("Gandalf "); 
$mage->race("Istar"); 

$mage->surnoms( [ "Mithrandir", "Olorin", "Incanus"] ); 

Le module Class: : Struct a cree ces quatre methodes. Comme il respecte le principe 
« resistant aux sous-classes » de to uj ours prefixer le nom du champ avec le nom de la 
classe, il permet aussi sans conflit a une sous-classe d'avoir son propre champ separe de 
meme nom qu'un champ de la classe de base. Cela veut dire qu'il utilise ici 
« Personne : : nom » au lieu du simple « nom » comme clef de hachage pour cette variable 
d'instance. 

Les champs d'une declaration struct ne sont pas obligatoirement des types Perl de base, 
lis peuvent aussi specifier d'autres classes, mais les classes creees avec struct fonction- 
nent le mieux car la fonction fait des presuppositions sur le comportement des classes 
qui ne sont pas generalement vraies de toutes les classes. Par exemple, la methode new 
de la classe appropriee est invoquee pour initialiser le champ, mais beaucoup de classes 
ont des constructeurs nommes differemment. 

Voir la description de Class : : Struct au chapitre 32, Modules standards, et sa documen- 
tation en ligne pour plus d'information. Beaucoup de modules standard utilisent 
Class: : Struct pour implementer leurs classes, dont notamment User::pwent et 
Net : : hostent. La lecture de leur code peut s'averer instructive. 

Generation d'accesseurs par autochargement 

Comme nous l'avons mentionne precedemment, lorsque vous invoquez une methode 
inexistante, Perl cherche une methode AUTOLOAD de deux facons differentes, selon que 
vous ayez declare la methode ou non. Vous pouvez utiliser cette propriete pour donner 
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acces aux donnees d'instance de l'objet sans definir une fonction differente pour chaque 
variable d'instance. Dans la fonction AUTOLOAD, le nom de la methode reellement invo- 
quee peut etre determine a partir de la variable $AUT0L0AD. Examinons le code suivant : 

use Personne; 
$lui = Personne->new; 
$lui- >nom( "Aragorn " ) ; 
$lui->race(" Homme"); 

$lui->surnoms( ["Grands-Pas", "Estel", "Elessar"] ); 

printf "La race de %s est : %s.\n", $lui->nom, $lui->race; 

print "Ses surnoms sont : ", join(", ", @{$lui->surnoms}) , ".\n"; 

Comme precedemment, cette classe Personne implemente une structure de donnees 
avec trois champs : nom, race, et surnoms : 

package Personne; 
use Carp; 

my %Fields = ( 

"Personne: :nom" => "pas de nom", 
"Personne: :race" => "inconnue", 
"Personne: :surnoms" => [], 

); 

# Cette declaration nous assure d'obtenir notre propre autochargeur 
use subs qw(nom race surnoms); 

sub new { 

my $invoquant = shift; 

my $classe = ref ($invoquant) | | $invoquant; 

my $self = { %Fields, @>_ }; # doner comme Class: :Struct 

bless $self, $classe; 

return $self; 



sub AUTOLOAD { 

my $self = shift; 

# ne gerer que les methode d'instance, pas les methodes de classe 
croak "$self n'est pas un objet" unless ref($self); 
my $nom = our $AUT0L0AD; 
return if $nom =~ /: :DESTR0Y$/; 
unless (exists $self->{$nom}) { 

croak "impossible d'acceder au champ f $nom' dans $self"; 

} 

i"f (@_) { return $self->{$nom} = shift } 
else { return $self->{$nom} } 

} 

Comme vous le voyez, il n'y a aucune mention de methodes nominees nom, race ou 
surnoms. La fonction AUTOLOAD prend tout cela en charge. Lorsque quelqu'un utilise 
$lui->nom("Aragorn"), la fonction AUTOLOAD est appelee avec la valeur 
« Personne: :nom » affectee a $AUT0L0AD. Commodement, le nom qualifie est exacte- 



Gestion des donnees d'instance 



311 



ment sous la forme necessaire pour acceder au champ du hachage de l'objet. Ainsi si 
vous utilisez cette classe a l'interieur d'une hierarchie de classes, vous n'entrerez pas en 
conflit avec l'utilisation du meme nom dans d'autres classes. 

Generation d'accesseurs par fermetures 

La plupart des methodes accesseurs font essentiellement la meme chose : elles ne font 
que recuperer ou stocker une valeur dans une variable d'instance. En Perl, la facon la 
plus naturelle de creer une famille de fonctions quasiment identiques est de boucler 
autour d'une fermeture. Mais une fermeture est une fonction anonyme, et une metho- 
de, pour qu'elle puisse etre appelee par nom, doit etre une fonction nommee dans la 
table de symboles du paquetage de la classe. Ceci n'est pas un probleme — il suffit d'af- 
fecter la reference a la fermeture a un typeglob de nom approprie. 

package Personne; 

sub new { 

my $invoquant = shift; 

my $self = bless({}, ref $invoquant | | $invoquant); 

$self->init(); 

return $self; 

} 

sub init { 

my $self = shift; 
$self->nom("pas de nom"); 
$self->race("inconnue"); 
$self->surnoms([]); 

} 

for my $champ (qw(nom race surnoms)) { 
my $slot = PACKAGE . "::$champ"; 

no strict "refs"; # Pour que fonctionne la ref symbolique au typeglob 
*$slot = sub { 

my $self = shift; 

$self->{$champ} = shift if @_; 

return $self->{$champ}; 

}; 

} 

Les fermetures sont la facon « fait main » la plus propre de creer une multitude de me- 
thodes accesseurs pour vos donnees d'instance. C'est une methode efficace a la fois pour 
l'ordinateur et pour vous. Non seulement tous les accesseurs partagent le meme bout 
de code (ils ne necessitent que leur propre emplacement lexical), mais plus tard si vous 
decidez d'ajouter un autre attribut, les changements requis sont minimaux : il suffit 
d'ajouter un mot de plus a la liste de la boucle for, et peut-etre quelque chose a la me- 
thode init. 
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Utilisation defermetures pour objets prives 

Jusqu'ici, ces techniques de gestion de donnees d'instance n'ont propose aucun mecanis- 
me pour les « proteger » d'acces externes. Toute personne en dehors de la classe peut 
ouvrir la boite noire de l'objet et fouiner dedans — si elle n'a pas peur d'annuler la ga- 
rantie. Imposer un espace prive obligatoire tend a mettre des batons dans les roues de 
personnes qui essaient simplement de faire leur travail. Perl part du principe qu'il est 
mieux d'encapsuler ses donnees avec un ecriteau sur lequel il est ecrit : 

EN CAS D'INCENDIE 
BRISER LA GLACE 

Vous devez si possible respecter l'encapsulation, tout en gardant un acces aise au conte- 
nu en cas d'urgence, comme pour le debogage. 

Mais si vous souhaitez imposer un espace prive, Perl ne va pas vous en empecher. Perl 
fournit des briques de base de bas niveau dont vous pouvez faire usage pour entourer 
votre classe et ses objets d'un bouclier impenetrable d'espace prive — un bouclier en 
fait plus fort que celui dont on dispose dans de nombreux langages orientes objet. Les 
portees lexicales et les variables lexicales qu'ils contiennent en sont les elements princi- 
paux, et les fermetures y jouent un role essentiel. 

Dans la section Me'thodes prive'es, nous avons vu comment une classe peut utiliser les fer- 
metures pour implementer des methodes qui sont invisibles a l'exterieur du fichier de 
module. Plus loin nous verrons des methodes accesseurs qui regulent des donnees de 
classe si privees que meme le reste de la classe n'y a pas un acces illimite. Ces techniques 
restent des utilisations assez traditionnelles des fermetures. L'approche veritablement 
interessante est d'utiliser une fermeture pour l'objet lui-meme. Les variables d'instance 
de l'objet sont verrouillees a l'interieur d'une portee a laquelle seul l'objet — c'est-a-di- 
re, la fermeture — a librement acces. Ceci est une forme tres forte d'encapsulation ; elle 
empeche non seulement toute alteration de l'exterieur, mais aussi d'autres methodes de 
la meme classe doivent utiliser les methodes d'acces appropriees pour acceder aux don- 
nees d'instance de l'objet. 

Voici un exemple de comment cela pourrait fonctionner. Nous utiliserons des fermetu- 
res a la fois pour les objets eux-memes et pour les accesseurs generes : 

package Personne; 
sub new { 

my $invoquant = shift; 

my $classe = ref ($invoquant) | | $invoquant; 
my $donnees = { 

NOM => "pas de nom", 

RACE => "inconnue", 

SURNOMS => [], 

}; 

my $self = sub { 
my $champ = shift; 

### METTRE LES VERIFICATIONS D'ACCES ICI ### 
############################################ 
if (@_) { $donnees->{$champ} = shift } 
return $donnees->{$champ}; 
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h 

bless($self, $classe); 
return $self; 

} 

# generer les noms de methodes 

for my $champ (qw(nom race surnoms)) { 

no strict "refs"; # pour l'acces a la table de symboles 
*$champ = sub { 

my $self = shift; 

return $self->(uc $champ, @_); 

h 

} 

L'objet cree et retourne par la methode new n'est plus un hachage, comme c'etait le cas 
des autres constructeurs que nous avons vus. C'est une fermeture avec acces unique aux 
donnees des attributs stockes dans le hachage reference par $donnees. Une fois Fappel 
au constructeur termine, Faeces a $donnees (et done aux attributs) ne se fait plus que 
par la fermeture. 

Dans un appel comme $lui- >nom( " Bombadil" ), l'objet invoquant stocke dans $self est 
la fermeture consacree et retoumee par le constructeur. On ne peut pas faire grand-cho- 
se avec une fermeture sinon l'appeler, done c'est ce que nous faisons avec $self->(uc 
$champ, @_). Ne vous laissez pas tromper par la fleche : ceci n'est qu'un appel de fonc- 
tion indirect, pas une invocation de methode. Le parametre initial est la chaine « nom », 
et d'autres parametres peuvent etre passes a sa suite. 7 Une fois qu'on s'execute a Finte- 
rieur de la fermeture, la reference de hachage dans $donnees est a nouveau accessible. 
La fermeture est alors libre de permettre ou d'interdire Faeces a ce qui lui plait. 

Personne en dehors de l'objet fermeture n'a d'acces direct a ces donnees d'instance ex- 
tremement privees, pas mime les autres methodes de la classe. Elles pourraient essayer 
d'appeler la fermeture de la mime facon que le font les methodes generees par la boucle 
for, definissant eventuellement une variable d'instance dont la classe n'aurait jamais 
entendu parler. Mais cette approche est aisement bloquee en inserant divers bouts de 
code dans le constructeur a Fendroit du commentaire sur les verifications d'acces. 
D'abord, nous avons besoin d'un preambule commun : 

use Carp; 

local $Carp: :CarpLevel =1; # Afficher des messages croak courts 
my ($pack_appelant, $fichier_appelant) = callerQ; 

Ensuite nous faisons chacune des verifications. La premiere s'assure que le nom d'attri- 
but existe : 

croak "Pas de champ valide 'Schamp' dans l'object" 
unless exists $donnees->{$champ}; 

Celle-ci ne permet Faeces qu'aux appelants du mime fichier : 

carp "Acces direct interdit aux fichiers etrangers" 
unless $fichier_appelant eq FILE ; 



7. Bien sur, le double appel de fonction est lent, mais si vous vouliez que ce soit rapide, auriez 
vous vraiment choisi d'utiliser des objets ? 
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Celle-ci ne permet l'acces qu'aux appelants du meme paquetage : 

carp "Acces direct interdit au paquetage etranger ${pack_appelant} : : " 
unless $pack_appelant eq PACKAGE ; 

Et celle-ci ne permet Faeces qu'aux appelants dont la classe herite de la notre : 

carp "Acces direct interdit a la classe inconnue ${pack_appelant}: :" 
unless $pack_appelant->isa( PACKAGE ); 

Toutes ces verifications ne font qu'empecher l'acces direct. Les utilisateurs d'une classe 
qui, poliment, n'emploient que les methodes de classes prevues ne souffrent pas d'une 
telle restriction. Perl vous donne les outils pour etre aussi maniaque que vous le souhai- 
tez. Heureusement, peu de gens souhaitent etre vraiment maniaques. 

Mais certaines personnes devraient l'etre. C'est bien d'etre maniaque lorsqu'on ecrit un 
logiciel de calculateur de vol. Si vous voulez etre ou devriez etre une telle personne, et 
que vous preferez utiliser du code fonctionnel au lieu de tout reinventer vous-meme, 
jetez un coup d'ceil sur CPAN au module Tie: : SecureHash de Damian Conway. II im- 
plemente des hachages restreints qui permettent des maniaqueries publiques, protegees 
ou privees. Damian a aussi ecrit un module encore plus ambitieux, Class: : Contract, 
qui impose un regime d'ingenierie logicielle formelle au systeme objet flexible de Perl. 
La liste des fonctionnalites de ce module ressemble a la liste de controle d'un livre ecrit 
par un professeur d'ingenierie logicielle 8 , avec notamment l'encapsulation obligatoire, 
l'heritage statique, et la verification de conditions de conception par contrat pour le Perl 
oriente objet, avec une syntaxe declarative pour les definitions d'attribut, de methode, 
de constructeur, et de destructeur, a la fois au niveau de l'objet et de la classe, et des pre- 
conditions, des post-conditions, et des invariants de classe. Ouf ! 



Nouvelles astuces 

Depuis la version 5.6 de Perl, vous pouvez aussi declarer une methode pour indiquer 
qu'elle retourne une lvalue. Ceci se fait avec l'attribut de fonction lvalue (a ne pas con- 
fondre avec les attributs d'objet). Cette fonctionnalite experimentale vous permet de 
traiter une methode comme quelque chose qui apparaitrait du cote gauche d'un signe 
egal: 

package Bestiau; 

sub new { 

my $classe = shift; 

my $self = { petits => 0, @_ }; # Supplanter la valeur par defaut. 
bless $self , $classe; 

} 

sub petits : lvalue { # Nous affecterons a petitsQ plus loin, 

my $self = shift; 
$self->{petits}; 

} 



8. Pouvez-vous deviner la profession de Damian ? A propos, nous vous recommandons forte- 
ment son livre, Object Oriented Perl (Manning Publications, 1999). 
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package main; 

$vermine = Bestiau->new(petits => 4); 

$vermine->petits *= 2; # Affecter a $vermine->petits ! 

$vermine->petits =~ s/(.)/$l$l/; # Modifier $vermine->petits sur place ! 
print $vermine->petits; # Nous avons maintenant 88 petits. 

Ceci vous laisse faire semblant que $vermine->petits est une variable tout en respec- 
tant l'encapsulation. Voir la section L'attribut lvalue du chapitre 6, Sous-programmes. 

Si vous executez une version de Perl avec threads et que vous voulez vous assurer qu'un 
seul thread n'appelle une methode donnee pour un objet, vous pouvez faire cela avec 
les attributs locked et method : 

sub petits : locked method { 
} 

Lorsqu'un thread invoque la methode petits pour un objet, Perl verrouille l'objet 
avant execution, empechant d'autres threads de faire la meme chose. Voir la section Les 
attibuts locked et method du chapitre 6. 

Gestion des donnees de classe 

Nous avons examine plusieurs approches pour acceder aux donnees associees a un ob- 
jet. Mais parfois vous voulez un etat commun partage par tous les objets d'une classe. 
Au lieu d'etre seulement un attribut d'une instance de la classe, ces variables sont glo- 
bales pour la classe entiere, quelle que soit l'instance de classe (l'objet) que vous utilisez 
pour y acceder. (Les programmeurs C++ les appelleraient des membres statiques de la 
classe.) Voici des situations oil ces variables de classe seraient commodes : 

• Pour compter au fur et a mesure tous les objets crees, ou tous les objets en cours 
d'utilisation. 

• Pour garder la liste de tous les objets, liste que vous pouvez parcourir. 

• Pour stocker le nom ou le descripteur d'un fichier log utilise par une methode de 
debogage de toute la classe. 

• Pour recenser des donnees accumulees, comme la somme totale de liquide distri- 
bute en une journee par tous les distributeurs de billets d'un reseau. 

• Pour suivre le dernier objet cree par une classe ou l'objet le plus utilise. 

• Pour gerer un cache des objets en memoire qui ont deja ete reconstitues a partir 
d'une memoire persistante. 

• Pour fournir une table associative inversee permettant de trouver un objet a partir 
de la valeur de l'un de ses attributs. 

II reste a decider ou stocker l'etat de ces attributs partages. Perl n'a pas de mecanisme 
syntaxique particulier pour declarer les attributs de classe, pas plus qu'il n'en a pour les 
attributs d'instance. Perl fournit au developpeur un large ensemble de fonctionnalites 
puissantes mais f lexibles qui peuvent etre adaptees habilement aux exigences particu- 
lieres d'une situation. Vous pouvez done selectionner le mecanisme qui correspond le 
mieux a la situation donnee au lieu de devoir vivre avec les choix de conception de quel- 
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qu'un d'autre. Ou alors, vous pouvez vivre avec les choix de conception que quelqu'un 
d'autre a empaquete et mis sur CPAN. Comme toujours, il y a plus d'une facon de le 
faire, TMTOWTDI. 

Comme pour tout ce qui a trait a une classe, on ne doit pas acceder directement aux 
donnees de classe, particulierement de l'exterieur de l'implementation de la classe elle- 
meme. Ce n'est guere respecter l'encapsulation que de soigneusement creer des metho- 
des accesseurs pour les variables d'instance mais ensuite d'inviter le public a tripoter di- 
rectement vos variables de classe, en affectant par exemple $UneClasse: : Debug = 1. 
Pour etablir une barriere bien claire entre interface et implementation, vous pouvez, 
pour manipuler les donnees de classe, creer des methodes accesseurs similaires a celles 
que vous employez pour les donnees d'instance. 

Imaginons que nous voulions connaitre a tout moment le compte de la population 
mondiale des objets Bestiau. Nous rangeons ce nombre dans une variable de paqueta- 
ge, mais nous fournissons une methode appelee population pour que les utilisateurs de 
la classe n'aient pas a connaitre son implementation. 

Bestiau->population() # Acces par le nom de classe 

$gollum->population() # Acces par l'instance 

Comme en Perl une classe n'est qu'un paquetage, une variable de paquetage est l'endroit 
le plus naturel pour ranger une donnee de classe. Voici une implementation simple 
d'une telle classe. La methode population ne tient pas compte de son invoquant et ne 
fait que retourner la valeur courante de la variable de paquetage $Population. (Certains 
programmeurs aiment commencer leurs variables globales par une majuscule.) 

package Bestiau; 

our $Population = 0; 

sub population { return $Population; } 

sub DESTROY { $Population-- } 

sub engendrer { 

my $invoquant = shift; 

my $classe = ref ($invoquant) | | $invoquant; 
$Population++; 

return bless { nom => shift | | "anon" }, $classe; 

} 

sub nom { 

my $self = shift; 
$self->{nom} = shift if @_; 
return $self->{nom}; 

} 

Si vous voulez creer des methodes de donnees de classe qui fonctionnent comme les ac- 
cesseurs de donnees d'instance, faites ceci : 

our $Deboguage =0; # donnee de classe 
sub debug { 

shift; # on ignore intentionnellement l'invoquant 

$Deboguage = shift if |5)_; 
return $Deboguage; 

} 

Maintenant vous pouvez specifier le niveau de debogage global avec la classe ou avec 
l'une quelconque de ses instances. 
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Comme $Deboguage est une variable de paquetage, elle est globalement accessible. Mais 
si vous changez la variable our en variable my, seul peut la voir le code situe a sa suite 
dans le fichier. Vous pouvez en faire encore plus — vous pouvez mime restreindre Fae- 
ces aux attributs de classe au reste de la classe elle-meme. Emballez la declaration de va- 
riable dans une portee de bloc : 

{ 

my $Deboguage =0; # donnee de classe a portee lexicale 

sub debug { 

shift; # on ignore intentionnellement l'invoquant 

$Deboguage = shift if @_; 
return $Deboguage; 

} 

} 

Maintenant personne n'a le droit de lire ou d'ecrire les attributs de classe sans utiliser la 
methode accesseur, puisque seule cette fonction est dans la meme portee que la variable 
et y a acces. 

Si une classe derivee herite de ces accesseurs de classe, ils accedent tout de meme aux 
donnees d'origine, que ces variables soient declarees avec our ou avec my. Les donnees ne 
sont pas relatives au paquetage. Vous pouvez considerer que les accesseurs s'executent 
dans la classe ou ils ont ete definis a l'origine, pas dans la classe qui les invoque. 

Pour certaines donnees de classe, cette approche fonctionne correctement, mais pour 
d'autres non. Supposons que nous creions une sous-classe Ouargue de Bestiau. Si nous 
voulons garder separees nos populations, Ouargue ne peut heriter de la methode popu- 
lation de Bestiau, car cette methode telle qu'elle est ecrite retourne la valeur de $Bes- 
tiau: : Population. 

II vous faudra decider selon le cas de l'utilite de rendre les attributs de classe relatifs au 
paquetage. Si vous voulez des attributs relatifs au paquetage, utilisez la classe de l'invo- 
quant pour situer le paquetage contenant les donnees de classe : 

sub debug { 

my $invoquant = shift; 

my $classe = ref ($invoquant) | | $invoquant; 
my $nom_var = $classe . " : :Deboguage"; 

no strict "refs"; # pour acceder symboliquement 

#aux donnees de p aquetage 

$$nom_var = shift if §_; 
return $$nom_var; 

} 

Nous annulons temporairement le pragma strict references car sans cela nous ne pour- 
rions pas utiliser le nom symbolique qualifie de la variable globale de paquetage. Ceci 
est parfaitement raisonnable : puisque toutes les variables de paquetage se trouvent par 
definition dans la table de symboles du paquetage, il n'y a pas de mal a y acceder par la 
table de symboles de ce paquetage. 

Une autre approche consiste a rendre disponible tout ce dont a besoin un objet — y 
compris ses donnees globales de classe — par l'objet (ou passe en tant que parametre). 
Pour ce faire, vous aurez souvent a creer un constructeur specifique pour chaque classe 
ou au moins une fonction d'initialisation specifique a appeler par le constructeur. Dans 
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le constructeur ou l'initialiseur, vous stockez des references aux donnees de classe direc- 
tement dans l'objet lui-meme, pour ne pas devoir les chercher plus tard. Les methodes 
accesseurs utilisent l'objet pour trouver une reference aux donnees. 

Au lieu de mettre la complexite de la recherche des donnees de classe dans chaque me- 
thode, laissez simplement dire par l'objet a la methode oil se situent les donnees. Cette 
approche ne fonctionne bien que lorsque les methodes d'acces aux donnees de classe 
sont invoquees comme methodes d'instance, car les donnees de classe pourraient etre 
dans des variables lexicales inaccessibles a partir du nom d'un paquetage. 

De quelque facon que Ton s'y prenne, les donnees de classes relatives a un paquetage 
sont toujours un peu incommodes. C'est vraiment plus propre si, lorsque vous heritez 
d'une methode d'acces a une donnee de classe, vous heritez aussi de la donnee d'etat a 
laquelle elle accede. Voir la page man perltootc pour de nombreuses approches plus ela- 
borees de la gestion des donnees de classe. 

Resume 

C'est a peu pres tout ce qu'il y a a savoir, sauf tout le reste. Maintenant vous n'avez plus 
qu'a aller acheter un livre sur la methodologie de la conception orientee objet et vous 
cogner le front avec durant six mois environ. 
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Les objets sont chics, mais parfois ils sont juste un peu trop chics. Parfois Ton prefererait 
qu'ils se comportent un peu moins comme des objets et un peu plus comme des types 
de donnees ordinaires. Mais voila le hie : les objets sont des referents represented par des 
references, et celles-ci ne sont guere utiles sauf comme references. Vous ne pouvez pas 
aj outer des references, ou les afficher, ou leur appliquer (utilement) la plupart des ope- 
rateurs predefinis de Perl. La seule chose que vous puissiez faire e'est les dereferencer. 
Done vous finissez par ecrire beaucoup d'invocations de methode explicites, comme 
ceci : 

print $objet->comme_chaine; 
$nouvel_objet = $sujet->ajouter($objet); 

De telles references explicites sont en general une bonne chose ; vous ne devez jamais 
confondre vos references avec vos referents, sauf quand vous voulez les confondre. C'est 
le cas qui se presente ici. Si vous concevez votre classe avec la surcharge, vous pouvez faire 
comme si les references n'etaient pas la et dire simplement : 

print $objet; 

$nouvel_objet = $sujet + $objet; 

Lorsque vous surchargez Fun des operateurs predefinis de Perl, vous definissez com- 
ment il se comporte lorsqu'il est applique aux objets d'une classe donnee. Un certain 
nombre de modules Perl standard utilisent la surcharge, comme Math: :BigInt, qui 
vous permet de creer des objets Math : : Biglnt se comportant comme des entiers ordi- 
naires mais sans limite de taille. Vous pouvez les aj outer avec +, les diviser avec /, les 
comparer avec <=>, et les afficher avec print. 

Notez que la surcharge differe de Fautochargement, qui charge a la demande une fonc- 
tion manquante. II faut egalement distinguer entre surcharger et supplanter, qui mas- 
que une fonction avec une autre. La surcharge ne cache rien ; elle ajoute un sens a une 
operation qui n'aurait pas de sens sur une simple reference. 
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Le pragma overload 

Le pragma use overload implemente la surcharge d'operateur. Vous lui fournissez une 
liste de couples clef/valeur d'operateurs et de leur comportement associe : 

package MaClasse; 

use overload '+' => \8rnion_addition, # ref de code 

'<' => "inferieur_a" , # methode nommee 

'abs' => sub { return @_ }; # fonction anonyme 

Maintenant lorsque vous ajoutez deux objets MaClasse, la fonction mon_addition est 
appelee pour creer le resultat. 

Lorsque vous comparez deux objets MaClasse avec l'operateur <, Perl remarque que le 
comportement est specifie par une chame et interprete la chaine comme le nom d'une 
methode et non comme un simple nom de fonction. Dans l'exemple ci-dessus, la me- 
thode inferieur_a pourrait etre fournie par le paquetage MaClasse lui-meme ou heri- 
tee d'une classe de base de MaClasse, mais la fonction mon_addition doit etre fournie 
dans le paquetage courant. La fonction anonyme pour abs est fournie encore plus direc- 
tement. De quelque maniere que ces fonctions soient fournies, nous les appellerons des 
handlers. 

Dans le cas des operateurs unaires (ceux qui ne prennent qu'un seul operande, comme 
abs), le handler specifie pour une classe est invoque a chaque fois que l'operateur est 
applique a un objet de cette classe. 

Dans le cas des operateurs binaires comme + ou <, le handler est invoque lorsque le pre- 
mier operande est un objet de la classe ou lorsque le deuxieme operande est un objet de 
la classe et le premier operande n'a pas de comportement de surcharge. C'est pour que 
vous puissiez dire soit : 

$objet + 6 

soit : 

6 + $objet 

sans avoir a vous soucier de l'ordre des operandes. (Dans le deuxieme cas, les operandes 
seront permutes lorsqu'ils seront passes au handler.) Si notre expression etait : 

$animal + $legume 

et $animal et $legume etaient des objets de classes differentes, chacune utilisant la sur- 
charge, c'est le comportement de surcharge de $animal qui serait declenche. (Nous es- 
perons que l'animal aime les legumes.) 

II n'y a qu'un seul operateur trinaire (ternaire) en Perl, ? : , et vous ne pouvez pas le sur- 
charges Heureusement. 

Handlers de surcharge 

Lorsqu'un operateur surcharge s'execute, le handler correspondant est invoque avec 
trois parametres. Les deux premiers parametres sont les deux operandes. Si l'operateur 
n'utilise qu'un operande, le deuxieme parametre est undef. 
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Le troisieme parametre indique si les deux premiers parametres sont permutes. Meme 
selon les regies de Farithmetique ordinaire, certaines operations ne se soucient pas de 
Fordre de leurs parametres, comme l'addition et la multiplication, alors que d'autres si, 
comme la soustraction ou la division. 1 Considerez la difference entre : 

$objet - 6 

et : 

6 - $objet 

Si les deux premiers parametres d'un handler ont ete permutes, le troisieme parametre 
sera vrai. Sinon, le troisieme parametre sera faux, auquel cas on fera aussi une distinc- 
tion plus fine : si le handler a ete declenche par un autre handler en rapport avec Faf- 
fectation (si par exemple += appelle + pour determiner comment faire une addition), 
alors le troisieme parametre n'est pas simplement faux, mais undef. Cette distinction 
permet certaines optimisations. 

Par exemple, voici une classe qui vous permet de manipuler un intervalle borne d'en- 
tiers. Elle surcharge a la fois + et - de maniere a contraindre le resultat de l'addition ou 
de la soustraction d'objets a etre une valeur dans l'intervalle de 0 a 255 : 

package OctetBorne; 

use overload '+' => \&ajouter_borne, 

=> \&soustraire_borne; 

sub new { 

my $classe = shift; 
my $valeur = shift; 
return bless \$valeur => $classe; 

} 

sub ajouter_borne { 
my ($x, $y) = @_; 

my ($valeur) = ref($x) ? $$x : $x; 
$valeur += ref($y) ? $$y : $y; 
$valeur = 255 if $valeur > 255; 
$valeur = 0 if $valeur < 0; 
return bless \$valeur => ref($x); 

} 

sub soustraire_borne { 

my ($x, $y, $swap) = @_; 

my ($valeur) = (ref $x) ? $$x : $x; 

$valeur -= (ref $y) ? $$y : $y; 



1. Vos objets surcharges n'ont pas l'obligation de respecter les regies de Farithmetique ordinaire, 
bien entendu, mais il est habituellement conseille de ne pas surprendre son monde. Curieuse- 
ment, de nombreux langages font Ferreur de surcharger + avec la concatenation de chaines, qui 
n'est pas commutative et qui n'est que vaguement additive. Pour une approche differente, voir 
Perl 
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if ($swap) { $valeur = -$valeur } 
$valeur = 255 if $valeur > 255; 
$valeur = 0 if $valeur < 0; 
return bless \$valeur => ref($x); 

} 

package main; 

$octetl = 0ctetBorne->new(200); 
$octet2 = 0ctetBorne->new(l00); 

$octet3 = $octetl + $octet2; # 255 
$octet4 = $octetl - $octet2; # 100 
$octet5 = 150 - $octet2; # 50 

Vous noterez que chacune des fonctions est ici par necessite un constructeur, done cha- 
cune s'assure de consacrer (avec bless) son nouvel objet dans la classe courante, quelle 
qu'elle soit ; nous supposons que la classe peut etre heritee. Nous supposons aussi que 
si $y est une reference, e'est une reference a un objet de notre propre type. Au lieu de 
tester ref ($y), nous pourrions appeler $y->isa("0ctetBorne"), si nous voulions etre 
plus complet (et executer plus lentement). 

Operateurs surchargeables 

Vous ne pouvez surcharger que certains operateurs, qui sont listes dans le tableau 13-1. 
Les operateurs sont egalement listes dans le hachage %overload: :ops mis a disposition 
lorsque vous employez use overload, bien que la categorisation y soit legerement dif- 
ferente. 



Tableau 13-1. Operateurs surchargeables 



Categorie 


Operateurs 


Conversion 


"" 0+ bool 


Arithmetique 


+-*/%** x . neg 


Logique 


! 


Sur les bits 


& | ~ A ! « » 


Affectation 


+= -= *= /= %= **= x= .= «= >>= ++ -- 


Comparaison 


==<<=>>= != <=> It le gt ge eq ne cmp 


Mathematique 


atan2 cos sin exp abs log sqrt 


Iteratif 


<> 


Dereference 


${} @{} %{} &{} *{} 


Pseudo 


nomethod fallback => 



Notez que neg, bool, nomethod et fallback ne sont pas reellement des operateurs Perl. 
Les cinq operateurs de dereference, " " et 0+ ne ressemblent sans doute pas non plus a des 
operateurs. Neanmoins tous sont des clefs valides de la liste de parametres que vous 
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fournissez a use overload. Ceci n'est pas vraiment un probleme. Nous allons vous re- 
veler un petit secret : c'est un petit mensonge de dire que le pragma overload surcharge 
les operateurs. II surcharge les operations sous-jacentes, qu'elles soient invoquees expli- 
citement par leurs operateurs « officiels » ou implicitement par un operateur apparen- 
te. (Les pseudo-operateurs mentionnes ci-dessus ne peuvent etre invoques 
qu'implicitement.) En d'autres termes, la surcharge ne se produit pas au niveau syntaxi- 
que, mais au niveau semantique. Le but n'est pas d'avoir l'air bien, mais de faire ce qui 
est bien. Vous pouvez generalises 

Notez aussi que = ne surcharge pas l'operateur d'affectation de Perl, comme vous pour- 
riez le croire. Cela ne serait pas la bonne chose a faire. Nous verrons cela plus tard. 

Commencons par traiter les operateurs de conversion, non parce qu'ils sont les plus evi- 
dents (ils ne le sont pas), mais parce qu'ils sont les plus utiles. De nombreuses classes ne 
surchargent que la conversion en chaine, specifiee par la clef " ". (Oui, ce sont vraiment 
deux doubles apostrophes a la suite.) 

Operateurs de conversion : " ", 0+, bool 

Ces trois clefs vous permettent de fournir a Perl des comportements pour les con- 
versions automatiques en chaine, en nombre et en valeur booleenne, respective- 
ment. 

La conversion en chaine ou stringification a lieu lorsqu'une variable non-chaine est 
utilisee en tant que chaine. C'est ce qui se passe lorsque vous convertissez une varia- 
ble en chaine par affichage, par interpolation, par concatenation ou meme en l'uti- 
lisant comme clef de hachage. C'est la conversion en chaine qui fait que vous voyez 
quelque chose comme SCALAR(0xba5fe0) lorsque vous essayez d'afficher un objet 
avec print. 

La conversion en nombre ou numification a lieu lorsqu'une variable non-numeri- 
que est convertie en nombre dans un contexte numerique comme une expression 
mathematique, un indice de tableau, ou meme un operande de . . , l'operateur 
d'intervalle. 

Enfin, bien que personne ici n'ose tout a fait appeler cela boolification, vous pouvez 
definir comment un objet doit etre interprets en contexte booleen (comme if, 
unless, while, for, and, or, &&, | |, ?:, ou dans le bloc d'une expression grep) en 
creant un handler de bool. 

Si vous avez defini l'un des trois operateurs de conversion, les deux autres peuvent 
etre autogeneres (nous expliquerons l'autogeneration plus loin). Vos handlers peu- 
vent retourner la valeur qu'ils veulent. Notez que si l'operation qui a declenche la 
conversion est egalement surcharges, cette derniere surcharge aura lieu immediate- 
ment apres. 

Voici une demonstration de "" qui invoque le handler comme_chaine d'un objet au 
moment de la conversion en chaine. N'oubliez pas de delimiter les doubles apos- 
trophes : 

package Personne; 

use overload q("") => \&comme_chaine; 

sub new { 

my $classe = shift; 
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return bless { @_ } => $classe; 

} 

sub comme_chaine { 
my $self = shift; 
my ($clef, $valeur, $resultat); 
while (($clef, $valeur) = each %$self) { 
$resultat .= "$clef => $valeur\n"; 

} 

return $resultat; 

} 

$obj = Personne->new(taille => 72, poids => 165, yeux => "marron"); 
print $obj; 

Au lieu de quelque chose comme Personne=HASH(Oxbal350), ceci affiche (dans 
Fordre du hachage) : 

poids => 165 
taille => 72 
yeux => marron 

(Nous esperons sincerement que cette personne n'a pas ete mesuree en kilos et en 
centimetres.) 

Operateurs arithmetiques : +, -, * /, %, **, x, ., neg 

Ceux-ci devraient tous vous etres familiers, sauf neg, qui est une clef speciale de sur- 
charge du moins unaire : le - de -123. La distinction entre les clefs neg et - vous 
permet de specifier des comportements differents pour le moins unaire et pour le 
moins binaire, plus connu sous le nom de soustraction. 

Si vous surchargez - mais pas neg, et qu'ensuite vous utilisez le moins unaire, Perl 
vous emulera un handler de neg. Ceci est appele autoge'neration, et se produit lors- 
que certains operateurs peuvent raisonnablement etre deduits d'autres operateurs 
(en supposant que les operateurs surcharges auront le mime rapport que les opera- 
teurs ordinaires). Comme le moins unaire peut etre exprime en fonction du moins 
binaire (ainsi -123 equivaut a 0 - 123), Perl ne vous oblige pas a surcharger neg 
lorsque - suffit. (Bien stir, si vous avez arbitrairement specifie que le moins binaire 
divise le second parametre par le premier, le moins unaire sera une excellente 
maniere de lever une exception de division par zero.) 

La concatenation avec Foperateur . peut etre autogeneree a partir du handler de 
conversion de chaine (voir " " ci-dessus). 

Operateur logique : ! 

Si un handler pour ! n'est pas specifie, il peut etre autogenere a partir du handler 
de bool, "", ou 0+. Si vous surchargez Foperateur !, Foperateur not declenchera 
aussi le comportement que vous avez specifie. (Vous souvenez-vous de notre petit 
secret ?) 

Vous serez peut-etre surpris par Fabsence des autres operateurs logiques, mais ils ne 
peuvent pas pour la plupart etre surcharges car ils font un court-circuit. Ce sont en 
realite des operateurs de flot de controle qui doivent etre capables de retarder Feva- 
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luation de certains de leurs parametres. C'est aussi la raison pour laquelle l'opera- 
teur ? : n'est pas surchargeable. 

Operateurs sur les bits \, ~, A , «, » 

L'operateur ~ est un operateur unaire ; tous les autres sont binaires. Void comment 
nous pourrions surcharger >> pour faire quelque chose comme chop : 
package DecaleChaine; 

use overload 

'»' => \&decale_droite, 
""" => sub { ${ $_[o] } }; 

sub new { 

my $classe = shift; 
my $valeur = shift; 
return bless \$valeur => $classe; 

} 

sub decale_droite { 
my ($x, $y) = @_; 
my $valeur = $$x; 
substr($valeur, -$y) = ""; 
return bless \$valeur => ref($x); 

} 

$chameau = DecaleChaine->new("Chameau"); 

$belier = $chameau >> 2; 

print $belier; # Chame 

Operateurs d 'affectation : +=, -=, *=, /=, %=, **=, x=, .=, <<=, »=, ++, -- 

Ces operateurs d'affectation peuvent changer la valeur de leurs parametres ou les 
laisser inchanges. Le resultat n'est affecte a l'operateur de gauche que si la nouvelle 
valeur differe de l'ancienne. Ceci permet d'utiliser le mime handler a la fois pour 
+= et pour +. Bien que ce soit permis, ceci est rarement recommande, puisque 
d'apres la semantique decrite plus loin dans la section Lorsqu'un handler de surcharge 
fait defaut (nomethod et fallback), Perl invoquera de toute facon le handler de +, en 
supposant que += n'ait pas ete surcharge directement. 

La concatenation ( . =) peut etre autogeneree avec la conversion de chame, suivie de 
la concatenation de chaines ordinaire. Les operateurs ++ et - - peuvent etre autoge- 
neres a partir de + et de - (ou de += et de -=). 

II est attendu des handlers implementant ++ et - - qu'ils mutent (alterent) leur para- 
metre. Si vous vouliez que l'autodecrementation fonctionne pour les lettres comme 
pour les nombres, vous pourriez le faire avec un handler comme ceci : 
package DecMagique; 

use overload 

q(--) => \&decrementer, 
q("") => sub { ${ $_[0] } }; 
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sub new { 

my $classe = shift; 
my $valeur = shift; 
bless \$valeur => $classe; 

} 

sub decrementer { 

my @chaine = reverse split(//, ${ $_[o] } ); 
my $i; 

for ($i = 0; $i < (Schaine; $i++ ) { 
last unless $chaine[$i] =~ /a/i; 
$chaine[$i] = chr( ord($chaine[$i] ) + 25 ); 

} 

$chaine[$i] = chr( ord($chaine[$i] ) - 1 ); 
my $resultat = join(", reverse gchaine); 
$_[0] = bless \$resultat => ref($_[o]); 

} 

package main; 

for $normal (qw/perl NZ Pa/) { 

$magique = DecMagique->new($normal); 
$magique--; 

print "$normal devient $magique\n"; 

} 

Ce qui affiche : 

perl devient perk 
NZ devient NY 
Pa devient Oz 

inversant precisement l'operateur magique d'auto-incrementation de Perl. 
L'operation ++$a peut etre autogeneree avec $a += louavec$a = $a + i,et$a-- 
avec $a -= 1 ou $a = $a - 1. Cependant, cela ne declenche pas le comportement 
de copie d'un vrai operateur ++. Voir Le constructeur de copie (=) plus loin dans ce 
chapitre. 

Operateurs de comparaison : ==, <, <=, >, >=, !=, <=>, It, le, gt, ge, eq, ne, cmp 

Si <=> est surcharge, il peut servir pour autogenerer les comportements des opera- 
teurs suivants : <, <=, >, >=, ==, et !=. De maniere similaire, si cmp est surcharge, il 
peut servir pour autogenerer les comportements des operateurs suivants : It, le, 
gt, ge, eq, and ne. 

Notez que la surcharge de cmp ne vous permettra pas de trier les objets aussi facile- 
ment que vous le souhaiteriez, car ce sont les versions converties en chaines des 
objets qui seront comparees, et non les objets eux-memes. Si votre but etait de com- 
parer les objets eux-memes, vous auriez aussi a surcharger " ". 

Fonctions mathematiques : atan2, cos, sin, exp, abs, log, sqrt 

Si abs n'est pas disponible, il peut etre autogenere a partir de < ou de <=> en combi- 
naison avec le moins unaire ou avec la soustraction. 

Un operateur - surcharge peut servir a autogenerer les handlers manquants du 
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moins unaire ou de la fonction abs, qui peuvent aussi etre surcharges separement. 
(Oui, nous savons que abs ressemble a une fonction, alors que le moins unaire res- 
semble a un operateur, mais ils ne sont pas si differents que cela en ce qui concerne 
Perl.) 

Operateur iteratif: < > 

Le handler de <> peut etre declenche en utilisant la fonction readline (lorsqu'elle 
lit dans un fichier, comme dans while (<FH>)) ou la fonction glob (lorsqu'elle sert 
a faire un glob de fichiers, comme dans @f iles = <*.*>). 
package TirageHeureux; 

use overload 

'<>' => sub { 

my $self = shift; 

return splice @$self, rand @$self, 1; 

}; 

sub new { 

my $classe = shift; 

return bless [@_] => $classe; 

} 

package main; 

$loto = new TirageHeureux 1 . . 49; 

for (qw(ler 2eme 3eme 4eme Seme 6eme)) { 
$numero_chanceux = <$loto>; 

print "Le $_ numero chanceux est : $numero_chanceux\n"; 

} 

$numero_chanceux = <$loto>; 

print "\nEt le numero complementaire est : $numero_chanceux\n"; 
En France, ceci affiche : 

The ler numero chanceux est : 14 
The 2eme numero chanceux est : 29 
The 3eme numero chanceux est : 45 
The 4eme numero chanceux est : 23 
The 5eme numero chanceux est : 9 
The 6eme numero chanceux est : 25 

Et le numero complementaire est : 8 
et vous rapporte 98 450 870 F. 
Operateurs de dereferencement : ${}, @{}, %{}, &{}, *{} 

Les tentatives de dereferencement d'une reference de scalaire, de tableau, de 
hachage, de fonction, ou de glob peuvent etre interceptees en surchargeant ces cinq 
symboles. 
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La documentation Perl en ligne de overload montre comment vous pouvez utiliser 
ces operateurs pour simuler vos propres pseudo-hachages. Voici un exemple plus 
simple qui implemente un objet avec un tableau anonyme mais permet de le refe- 
rencer comme un hachage. N'essayez pas de le traiter comme un vrai hachage ; 
vous ne pourrez pas utiliser delete pour supprimer des couples clef/valeur de 
l'objet. Si vous voulez combiner les notations de tableau et de hachage, utilisez un 
vrai pseudo-hachage (si Ton peut dire), 
package PsychoHachage; 

use overload '%{}' => \&comme_hachage; 

sub comme_hachage { 
my ($x) = shift; 
return { @$x }; 

} 

sub new { 

my $classe = shift; 

return bless [§_]=> $classe; 

} 

$bestiau = new PsychoHachage( taille => 72, poids => 365, type => 
"chameau" ); 

print $bestiau->{poids}; # affiche 365 
Voyez aussi le chapitre 14, Variables lie'es, pour un mecanisme qui vous permet de 
redefinir les operations de base sur les hachages, les tableaux, et les scalaires. 

Lorsque vous surchargez un operateur, essayez de ne pas creer des objets avec des refe- 
rences sur eux-memes. Par exemple, 

use overload '+' => sub { bless [ \$_[o], \$_[l] ] }; 

Ceci revient a chercher des ennuis, car si vous dites $animal += $legume, le resultat fera 
de $animal une reference a un tableau consacre dont le premier element est $animal. 
Ceci est une reference circulaire, ce qui veut dire que si vous detruisez $animal, sa memoi- 
re ne sera liberee que lorsque se termine votre processus (ou votre interpreteur). Voir 
Ramasse-miettes, references circulaires et references faibles au chapitre 8, References. 

Le constructeur de copie (=) 

Bien qu'il ressemble a un operateur ordinaire, = a une signification speciale et legere- 
ment non-intuitive en tant que clef de surcharge. II ne surcharge pas l'operateur d'affec- 
tation de Perl. II ne le peut pas, car cet operateur doit etre reserve pour l'affectation des 
references, sinon plus rien ne fonctionne. 

Le handler de = est utilise dans des situations ou un operateur de mutation (comme ++, 
- - ou Fun des operateurs d'affectation) est applique a une reference qui partage son ob- 
jet avec une autre reference. Le handler de = vous permet d'intercepter l'operateur de 
mutation et de copier l'objet vous-meme de telle facon que la copie seule soit mutee (al- 
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teree). Sans cela, vous ecraseriez l'objet d'origine. 

$copie = $origine; # ne copie que la reference 
++$copie; # modifie l'objet partage sous-jacent 

C'est ici qu'il faut faire bien attention. Supposons que $origine soit une reference a un 
objet. Pour faire en sorte que ++$copie ne modifie que $copie et non $origine, on 
commence par faire une copie de $copie et Ton affecte a $copie une reference a ce nou- 
vel objet. Cette operation n'a lieu que lorsque ++$copie est execute, done $copie est 
identique a $origine avant l'incrementation — mais pas apres. En d'autres termes, c'est 
le ++ qui reconnait la necessite de faire une copie et qui appelle votre constructeur de 
copie. 

La necessite de faire une copie n'est reconnue que par les operateurs de mutations com- 
me ++ ou +=, ou par nomethod, decrit plus loin. Si l'operation est autogeneree avec +, 
comme dans : 

$copie = $origine; 
$copie = $copie + 1; 

alors il n'y a pas de copie, car + ne sait pas qu'il est utilise comme operateur de mutation. 

Si l'execution d'un operateur de mutation necessite le constructeur de copie, mais qu'un 
handler pour = n'est pas specifie, il peut etre autogenere comme copie de chaine tant 
que l'objet reste un simple scalaire et non quelque chose de plus complique. 

Par exemple, le code reellement execute lors de la sequence : 

$copie = $origine; 

++$copie; 

pourrait ressembler a quelque chose comme ceci : 
$copie = $origine; 

$copie = $copie->clone(undef , ""); 
$copie->incr(undef , ""); 

Dans cet exemple $origine fait reference a un objet surcharge, ++ est surcharge avec 
\&incr, et = est surcharge avec \&clone. 

Un comportement similaire est declenche par $copie = $origine++, ce qui est inter- 
prete comme $copie = $origine; ++$origine. 

Lorsqu'un handler de surcharge fait defaut 
(nomethod et fallback) 

Si vous appliquez un operateur non surcharge a un objet, Perl tente d'abord d'autoge- 
nerer un comportement a partir d'autres operateurs surcharges en utilisant les regies de- 
crites ci-dessus. Si cela echoue, Perl cherche un comportement de surcharge de 
nomethod et l'utilise s'il est disponible. Ce handler joue le meme role pour les operateurs 
que joue la fonction AUTOLOAD pour les fonctions : c'est ce que vous faites lorsque vous 
ne savez pas quoi faire d'autre. 
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Si elle est employee, la clef nomethod doit etre suivie d'une reference a un handler pre- 
nant quatre parametres (et non trois comme pour tous les autres handlers). Les trois 
premiers parametres ne different pas de ceux des autres handlers ; le quatrieme est une 
chaine correspondante a Foperateur dont le handler fait defaut. Ceci joue le meme role 
que la variable $ AUTO LOAD pour les fonctions AUTOLOAD. 

Si Perl doit chercher un handler de nomethod mais n'en trouve pas, une exception est 
levee. 

Si vous voulez empecher l'autogeneration, ou si vous voulez qu'une tentative d'autoge- 
neration infructueuse ne produise aucune surcharge, vous pouvez definir la clef specia- 
le de surcharge fallback. Celle-ci comporte trois etats : 

undef 

Si fallback n'est pas definie, ou si undef lui est explicitement affecte, la sequence 
d'evenements de surcharge n'est pas modifiee : Perl cherche les handlers, tente 
l'autogeneration, et finit par invoquer le handler de nomethod. Si cela echoue une 
exception est levee. 

faux 

Si Ton affecte a fallback une valeur definie mais fausse (comme 0), Perl ne tente 
jamais d'autogeneration. II appellera le handler de nomethod s'il existe, mais levera 
une exception dans le cas contraire. 

vrai 

Ceci est presque le meme comportement que pour undef, mais aucune exception 
n'est levee si un handler approprie ne peut etre synthetise par autogeneration. Au 
lieu de cela, Perl retourne au comportement non surcharge de cet operateur, 
comme si la classe ne contenait aucun pragma use overload. 
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Vous pouvez modifier la facon dont Perl interprete les constantes avec overload : : con- 
stant, qui est le plus utilement place dans la methode import d'un paquetage. (Si vous 
faites cela, vous devriez normalement invoquer overload: :remove_constant dans la 
methode unimport du paquetage pour que le paquetage puisse tout nettoyer lui-meme 
lorsque vous le lui demandez.) 

Les fonctions overload: : constant et overload: :remove_constant prennent chacune 
comme parametre une liste de couples clef/valeur. Les clefs doivent etre parmi les sui- 
vantes : integer, float, binary, q, et qr. Chaque valeur doit etre le nom d'une fonction, 
une fonction anonyme ou une reference de code qui traitera les constantes. 

sub import { overload: : constant ( integer => \&entier handler, 

float => \&decimal handler, 

binary => \&base_handler, 

q => \&chaine_handler, 

qr => \&regex_handler ) } 

Les handlers que vous specifiez pour integer et float sont invoques a chaque fois que 
l'analyseur lexical de Perl traite un nombre constant. Ceci est independant du pragma 
use constant ; de simples instructions comme : 
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$annee = cube(l2) + l; # entier 

$pi = 3.14159265358979; # nombre decimal 

declencheront le handler specifie. 

La clef binary vous permet d'intercepter des constantes binaires, octales et hexadecima- 
les. q traite les chaines entre apostrophes (dont les chaines introduites avec q) et les sous- 
chaines constantes contenues dans les chaines citees avec qq et qx et les documents ici- 
meme. Pour finir, qr traite les parties constantes contenues dans les expressions regulie- 
res, comme il est mentionne a la fin du chapitre 5, Recherche de motif. 

Le handler prend trois parametres. Le premier parametre est la constante d'origine, sous 
la forme fournie a Perl. Le deuxieme parametre contient la constante une fois qu'elle 
est interpretee par Perl ; par exemple, 123_456 apparaitra comme 123456. 

Le troisieme parametre n'est defini que pour les chaines traitees par les handlers de q et 
de qr et aura pour valeur qq, q, s ou tr selon l'utilisation de la chaine. qq signifie que la 
chaine provient d'un contexte interpole, comme les doubles apostrophes, les apostro- 
phes inverses, une correspondance m// ou le motif d'une substitution si 1 1 . q signifie 
que la chaine provient d'un contexte non interpole, s signifie que la constante est la 
chaine de remplacement d'une substitution s///, et tr signifie qu'elle est un compo- 
sant d'une expression tr/// ou y///. 

Le handler doit retourner un scalaire, qui sera utilise a la place de la constante. Souvent, 
ce scalaire sera une reference a un objet surcharge, mais rien ne vous empeche de faire 
quelque chose de plus pervers : 

package Doubleur; # Un module a placer dans Doubleur.pm 
use overload; 

sub import { overload: : constant ( integer => \&handler, 

float => \&handler ) } 

sub handler { 

my ($orig, $interp, $contexte) = @_; 

return $interp * 2; # doubler toutes les constantes 

} 

i; 

Notez que handler est partage par les deux clefs, ce qui fonctionne correctement dans 
ce cas. Maintenant quand vous dites : 

use Doubleur; 

$ennuis = 123; # ennuis est maintenant 246 

$danger =3.21; # danger est maintenant 6.42 

vous redefinissez le monde. 

Si vous interceptez les chaines constantes, il est conseille de fournir egalement un ope- 
rateur de concatenation (« . »), puisqu'une expression interpolee comme "ab$cd! !" 
n'est qu'un raccourci pour l'expression plus longue 'ah' . $cd . ' ! ! '. De facon simi- 
laire, on considere les nombres negatifs comme les negations de constantes positives, 
done vous devez fournir un handler pour neg lorsque vous interceptez des entiers ou 
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des nombres decimaux. (II n'y avait pas besoin de faire cela ci-dessus car nous retour- 
nons des nombres, et non des references d'objets surcharges.) 

Notez que overload: : constant ne se propage pas a l'interieur d'un eval compile au 
moment de l'execution, ce qui est soit un bogue soit une fonctionnalite selon votre 
point de vue. 

Fonctions publiques de surcharge 

Depuis la version 5.6 de Perl, le pragma use overload fournit les fonctions suivantes a 
usage public : 

overload: :StrVal(OfiJ) 

Cette fonction retourne la valeur de chaine que retournerait OBJ en l'absence de la 
surcharge de la conversion en chaine (" "). 

overload: :0verloaded(06J) 

Cette fonction retourne vrai si OBJ est sujet a la surcharge d'un operateur quel qu'il 
soit, et faux s'il ne Test pas. 

overload: : Method (OB J, OPERATEUR) 

Cette fonction retourne une reference au code qui implemente la surcharge de 
OPERATEUR lorsqu'il opere sur OBJ, ou undef si une telle surcharge n'existe pas. 

Heritage et surcharge 

L'heritage interagit avec la surcharge de deux facons. La premiere a lieu lorsqu'un han- 
dler est nomme en tant que chaine au lieu d'etre specifie comme reference de code ou 
comme fonction anonyme. Lorsqu'il est nomme en tant que chaine le handler est inter- 
prete comme une methode, et peut done etre herite de surclasse. 

La deuxieme interaction entre l'heritage et la surcharge provient du fait que toute classe 
derivee d'une classe surcharged est elle-meme sujette a cette surcharge. En d'autres ter- 
mes, la surcharge est elle-meme heritee. L'ensemble des handlers d'une classe est l'union 
des handlers de tous les ancetres de cette classe, recursivement. Si un handler peut etre 
trouve dans plusieurs ancetres differents, le choix du handler a utiliser est regi par les 
regies habituelles d'heritage de methode. Par exemple, si la classe Alpha herite des clas- 
ses Betaet Gamma dans cet ordre, et que la classe Beta surcharge + avec \&Be- 
ta: :fonction_plus, mais que la classe Gamma surcharge + avec la chaine 
"methode_plus", alors e'est Beta: :fonction_plus qui sera appelee lorsque vous appli- 
quez + a un objet Alpha. 

Comme la valeur de la clef fallback n'est pas un handler, son heritage n'est pas regi par 
les regies ci-dessus. Dans l'implementation actuelle, on utilise la valeur de fallback du 
premier ancetre surcharge, mais ceci est accidentel et sujet a modification sans preavis 
(enfin, sans trop de preavis). 
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Surcharge a Vexecution 

Comme les instructions use sont executees a la compilation, la seule facon de modifier 
la surcharge a l'execution est : 

eval " use overload => \&mon_addition "; 
Vous pouvez aussi dire : 

eval " no overload '+', '<=' "; 

bien que l'emploi de ces formules a l'execution soit douteux. 

Surcharge de diagnostics 

Si votre Perl est compile avec -DDEBUGGING, vous pouvez voir les messages de diagnostics 
de surcharge lorsque vous executez un programme avec l'option -Do ou son equivalent. 
Vous pouvez aussi deduire quelles operations sont surchargees en utilisant la comman- 
de m du debogueur interne de Perl. 

Si maintenant vous vous sentez un peu surcharge, le chapitre suivant vous permettra 
peut-etre de lier un peu la sauce. 



14 

Variables liees 



Certaines activites humaines necessitent un deguisement. Parfois l'intention est de 
tromper, mais le plus souvent il s'agit de communiquer quelque chose de vrai a un ni- 
veau plus profond. Souvent, par exemple, quelqu'un qui vous fait passer un entretien 
d'embauche s'attend a ce que vous portiez une cravate pour signifier que vous souhaitez 
serieusement vous integrer, meme si vous savez tous les deux que vous ne porterez ja- 
mais de cravate au travail. C'est curieux lorsqu'on y pense : nouer un morceau de tissu 
autour de son cou peut magiquement vous obtenir un emploi. Dans la culture Perl, 
l'operateur de liaison tie 1 joue un role similaire : il vous permet de creer une variable 
apparemment normale qui, derriere son deguisement, est en fait un objet Perl a part 
entiere dont on peut s'attendre qu'elle ait sa propre personnalite interessante. C'est juste 
un drole de bout de magie, comme tirer Bugs Bunny d'un chapeau. 

Formule autrement, les droles de caracteres $, @, % ou * devant un nom de variable en 
disent long a Perl et a ses programmeurs — ils sous-entendent chacun un ensemble spe- 
cifique de comportements caracteristiques. Vous pouvez deformer ces comportements 
de diverses manieres utiles avec tie en associant la variable a une classe qui implemente 
un nouvel ensemble de comportements. Par exemple, vous pouvez creer un hachage 
Perl ordinaire et le lier avec tie a une classe qui transforme le hachage en base de don- 
nees, de sorte que quand vous lisez des valeurs du hachage, Perl va par magie chercher 
les donnees dans un fichier de donnees externe, et que quand vous affectez des valeurs 
au hachage, Perl stocke par magie les donnees dans le meme fichier. Ici, « par magie » 
signifie « en effectuant de maniere transparente quelque chose de tres complique ». 
Vous connaissez le vieux dicton : toute technologie suffisamment avancee est indiscer- 
nable d'un script Perl. (Serieusement, les gens qui jouent avec les tripes de Perl utilisent 
magique comme terme technique designant toute semantique supplemental attachee 
a des variables telles que %ENV ou %SIG. Les variables liees n'en sont qu'une extension.) 

Perl possede deja les fonctions internes dbmopen et dbmclose, qui lient magiquement des 
variables de hachage a des bases de donnees, mais ces fonctions datent du temps oil Perl 



1. Note du traducteur : en anglais « tie » signifie lier ou attacher, et... cravate. 
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n'avait pas l'operateur tie. Maintenant, tie fournit un mecanisme plus general. En fait, 
Perl lui-meme implemente dbmopen et dbmclose a l'aide de tie. 

Vous pouvez lier avec tie un scalaire, un tableau, un hachage ou un handle de fichier 
(via son typeglob) a toute classe qui fournit les methodes nominees de maniere appro- 
priee pour intercepter et simuler un acces normal a ces variables. La premiere de ces me- 
thodes est invoquee au moment de la liaison elle-meme : le fait de lier une variable 
invoque toujours un constructeur, qui retourne en cas de succes un objet que Perl stoc- 
ke a l'abri des regards, cache a l'interieur de la variable « normale ». Vous pouvez tou- 
jours recuperer cet objet plus tard en appliquant la fonction tied a la variable normale : 

tie VARIABLE, NOM_CLASSE, LISTE; # relie VARIABLE a NOM_CLASSE 
$objet = tied VARIABLE; 

Ces deux lignes sont equivalentes a : 

$objet = tie VARIABLE, NOM_CLASSE, LISTE; 

Une fois qu'elle est liee, vous pouvez traiter la variable normale normalement, mais 
chaque acces invoque automatiquement une methode de l'objet sous-jacent ; toute la 
complexite de la classe est cachee derriere ces appels de methodes. Si plus tard vous vou- 
lez rompre l'association entre la variable et la classe, vous pouvez delier la variable avec 
untie : 

untie VARIABLE; 

Vous pouvez presque considerer tie comme une espece de bless bizarre, a ceci pres 
qu'il consacre une simple variable au lieu d'une reference a un objet. II peut aussi pren- 
dre des parametres supplementaires, a l'instar d'un constructeur — ce qui n'est pas ter- 
riblement surprenant, dans la mesure ou il invoque un constructeur en interne, dont 
le nom depend du type de la variable que vous liez : TIESCALAR, TIEARRAY, TIEHASH ou 
TIEHANDLE. 2 Ces constructeurs sont invoques en tant que methodes de classe, avec 
NOM_CLASSE comme invoquant, plus tout parametre additionnel que vous donnez dans 
LISTE. (La VARIABLE n'est pas passee au constructeur.) 

Ces quatre constructeurs retournent chacun un objet de la facon habituelle. Ni les cons- 
tructeurs, ni les autres methodes de la classe ne se soucient vraiment de savoir s'ils ont 
ete invoques par tie, puisque vous pouvez toujours les invoquer directement si vous le 
souhaitez. En un sens, toute la magie se situe dans tie et non dans la classe implemen- 
tant le tie. La classe n'est en ce qui la concerne qu'une classe ordinaire avec des droles 
de noms de methode. (En effet, certains modules lies fournissent des methodes supple- 
mentaires qui ne sont pas visibles par la variable liee ; ces methodes doivent etre appe- 
lees explicitement comme vous le feriez pour toute autre methode d'objet. De telles 
methodes supplementaires pourraient fournir des services comme le verrouillage de fi- 
chiers, la protection de transactions, ou tout autre chose que pourrait faire une metho- 
de d'instance.) 

Ainsi ces constructeurs consacrent (avec bless) et retournent une reference d'objet 
comme le ferait toute autre constructeur. Cette reference ne doit pas forcement referen- 



2. Comme les constructeurs ont des noms distincts, vous pourriez meme fournir une classe uni- 
que les implementant tous. Cela vous permettrait de lier des scalaires, des tableaux, des hachages 
et des handles de fichiers a la meme classe, bien que ce ne soit generalement pas fait, car cela ren- 
drait delicat l'ecriture des autres methodes magiques. 
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cer le meme type de variable que celle qui est liee ; elle doit simplement etre consacree 
afin que la variable liee puisse retrouver le chemin de votre classe en cas de besoin. Par 
exemple, notre long exemple de TIEARRAY utilise un objet base sur un hachage afin qu'il 
puisse commodement contenir des informations supplementaires sur le tableau qu'il 
emule. 

La fonction tie n'executera pas a votre place de use ou de require — vous devez le faire 
vous-meme explicitement, avant d'appeler le tie. (Cela dit, pour des raisons de compa- 
tibility descendante, la fonction dbmopen tentera de faire un use de Fune ou l'autre im- 
plementation DBM. Mais vous pouvez l'empecher de choisir en faisant un use explicite, 
du moment que le module que vous specifiez figure dans la liste des modules que peut 
choisir dbmopen. Voir la doc en ligne du module AnyDBM_File pour une explication plus 
complete.) 

Les methodes appelees par une variable liee ont un nom predetermine comme FETCH 
(recuperer) et STORE (stocker), puisqu'elles sont invoquees implicitement (c'est-a-dire 
declenchees par des evenements specifiques) de Finterieur de la machinerie de Perl. Ces 
noms sont en MAJUSCULES, suivant la convention courante pour les fonctions appelees 
implicitement. (D'autres noms speciaux qui suivent cette convention sont BEGIN, CHECK, 
INIT, END, DESTROY et AUTOLOAD, sans parler de UNIVERSAL->VERSION. En fait, presque tou- 
tes les variables predefinies et les handles de fichiers de Perl sont en majuscules : STDIN, 
SUPER, CORE, CORE: :GL0BAL, DATA, (SEXPORT, @INC, gISA, @ARGV et %ENV Bien entendu, les 
operateurs internes et les pragmas, a l'extreme oppose, n'ont pas du tout de majuscules.) 

La premiere chose que nous traiterons est extremement simple : comment lier une va- 
riable scalaire. 

Liaison de scalaire 

Afin d'implementer un scalaire lie, une classe doit definir les methodes suivantes : 
TIESCALAR, FETCH et STORE (et eventuellement DESTROY). Lorsque vous liez une variable 
scalaire avec tie, Perl appelle TIESCALAR. Lorsque vous consultez la variable liee, il ap- 
pelle FETCH, et lorsque vous affectez une valeur a la variable, il appelle STORE. Si vous 
avez garde en main l'objet retourne par le tie initial (ou si vous le recuperez plus tard 
avec tied), vous pouvez acceder vous-meme a l'objet sous-jacent — ceci ne declenche ni 
FETCH ni STORE. En tant qu'objet, il n'est pas du tout magique, et tout a fait objectif. 

S'il existe une methode DESTROY, Perl l'invoque lorsque disparait la derniere reference a 
l'objet lie, comme pour tout autre objet. Cela se produit lorsque votre programme se 
termine ou lorsque vous appelez untie, ce qui elimine la reference utilisee par tie. Ce- 
pendant, untie n'elimine pas les references existantes que vous pourriez avoir stockees 
ailleurs ; DESTROY est reporte jusqu'a ce que ces references aient egalement disparu. 

Les paquetages Tie: : Scalar et Tie: :StdScalar, situes tous les deux dans le module 
Tie: : Scalar, fournissent des definitions de classe de base simples si vous ne souhaitez 
pas definir toutes ces methodes vous-meme. Tie :: Scalar fournit des methodes elemen- 
taires qui ne font quasiment rien, et Tie: :StdScalar fournit des methodes qui font se 
comporter un scalaire lie comme un scalaire Perl ordinaire. (Ce qui semble particulie- 
rement inutile, mais parfois vous voulez juste un leger emballage autour de la seman- 
tique de scalaire ordinaire, comme par exemple pour compter le nombre de fois qu'une 
variable donnee est affectee.) 
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Avant de vous montrer un exemple recherche et une description complete de toute la 
mecanique, voici juste un avant-gout pour vous mettre en appetit — et pour vous mon- 
trer a quel point c'est facile. Voici un programme complet : 

#!/usr/bin/perl 
package Centime; 

sub TIESCALAR { bless \my $self, shift } 

sub STORE { ${ $_[0] } = $_[l] } # faire Inaction par defaut 

sub FETCH { sprintf "%.02f", ${ my $self = shift } } # valeur arrondie 

package main; 

tie $francs, "Centime"; 

$francs = 45.00; 

$francs *= 1.0715; # taxe 

$francs *= 1.0715; # et double taxe ! 

print "Ce sera $francs francs, s'il vous plait. \n"; 

A l'execution, le programme affiche : 

Ce sera 51.67 francs, s'il vous plait. 
Pour voir la difference, mettez l'appel a tie en commentaire. Vous obtiendrez : 

Ce sera 51-66505125 francs, s'il vous plait. 
Reconnaissons que cela represente beaucoup d'efforts juste pour arrondir des nombres. 

Methodes de liaison de scalaire 

Maintenant que vous avez vu un echantillon de ce qui va venir, developpons une classe 
de liaison de scalaire plus recherchee. Au lieu d'utiliser un paquetage pret a Femploi 
pour la classe de base (et etant donne que les scalaires sont si simples), nous examine- 
rons tour a tour chacune des quatre methodes en construisant une classe exemple nom- 
inee FichierScalaire. Les scalaires lies a cette classe contiennent des chaines 
ordinaires, et chaque variable de ce type est implicitement associee au fichier dans le- 
quel la chaine est stockee. (Vous pourriez nommer vos variables de maniere a vous rap- 
peler a quel fichier vous faites reference.) Les variables sont liees a la classe de la maniere 
suivante : 

use FichierScalaire; # charger FichierScalaire. pm 

tie $chameau, "FichierScalaire", "/tmp/camel.ide"; 

Une fois la variable liee, son contenu d'origine est ecrase, et la connexion interne entre 
la variable et son objet supplante la semantique normale de la variable. Lorsque vous 
demandez la valeur de $chameau, elle lit le contenu de /tmp/camel.ide, et lorsque vous af- 
fectez une valeur a $chameau, elle ecrit le nouveau contenu dans /tmp/camel.ide, ecrasant 
tout occupant precedent. 

La liaison est faite sur la variable et non sur sa valeur, done la nature liee d'une variable 
n'est pas preservee par l'aftectation. Par exemple, supposons que vous copiiez une varia- 
ble liee : 

$dromadaire = $chameau; 

Au lieu de lire la valeur comme a l'ordinaire dans la variable scalaire $chameau, Perl in- 
voque la methode FETCH de l'objet associe sous-jacent. C'est comme si vous aviez ecrit 
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ceci : 

$dromadaire = (tied $chameau)->FETCH() : 

Ou si vous retenez l'objet retourne par tie, vous pouvez utiliser cette reference directe- 
ment, comme dans le code exemple suivant : 

$cide = tie $chameau, "FichierScalaire", "/tmp/camel.ide"; 
$dromadaire = $chameau; # par l'interface implicite 

$dromadaire = $cide->FETCH(); # pareil, mais explicitement 

Si la classe fournit des methodes autres que TIESCALAR, FETCH, STORE, et DESTROY, vous 
pouvez utiliser $cide pour les invoquer manuellement. Toutefois, ordinairement on 
s'occupe de ses propres affaires et on laisse l'objet sous-jacent tranquille, ce qui explique 
qu'on utilise rarement la valeur de retour de tie. Vous pouvez toujours recuperer l'ob- 
jet avec tied si vous en avez besoin plus tard (par exemple, si la classe documente 
d'autres methodes dont vous avez besoin). Ne pas utiliser l'objet retourne elimine aussi 
certains types d'erreur, ce que nous traiterons plus loin. 

Voici le preambule de notre classe, que nous mettrons dans FichierScalaire. pm : 
package FichierScalaire; 

use Carp; # Transmettre gentiment les messages d'erreur. 

use strict; # S'imposer un peu de discipline, 

use warnings; # Activer les avertissements de portee lexicale. 

use warnings: rregister; # Permettre a l'utilisateur de dire 

# "use warnings 'FichierScalaire-"'. 
my $compteur =0; # Compteur interne de FichierScalaires lies. 

Le module standard Carp exporte les fonctions carp, croak, et confess, que nous utili- 
serons dans le code plus loin. Comme d'habitude, voir le chapitre 32, Modules standards, 
ou la doc en ligne pour plus de details sur Carp. 

Les methodes suivantes sont definies par la classe : 

W0M_CL4SS£->TIESCALAR(Z.ISrE) 

La methode TIESCALAR de la classe est declenchee lorsque vous liez une variable 
avec tie. La LISTE en option contient les parametres necessaires pour initialiser 
l'objet correctement. (Dans notre exemple, il n'y a qu'un seul parametre : le nom 
du fichier.) La methode doit retourner un objet, mais celui-ci n'est pas necessaire- 
ment une reference a un scalaire. Mais il Test dans notre exemple. 
sub TIESCALAR { # dans FichierScalaire. pm 

my $classe = shift; 

my $nom_fichier = shift; 

$compteur++; # Une lexicale visible dans le fichier, 

# privee pour la classe 
return bless \$nom_f ichier, $classe; 

} 

Comme il n'y a pas d'equivalent scalaire des compositeurs de tableau et de hachage 
anonymes [ ] et { }, nous consacrons simplement le referent de la variable lexicale, 
qui devient de fait anonyme des la sortie de la portee lexicale du nom. Ceci fonc- 
tionne bien (vous pourriez faire de mime avec les tableaux et les hachages) tant 
que la variable est reellement lexicale. Si vous tentiez cette astuce avec une variable 
globale, vous pourriez croire vous en sortir jusqu'a ce que vous tentiez de creer un 
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autre camel.ide. Ne soyez pas tente d'ecrire quelque chose comme ceci : 
sub TIESCALAR { bless \$_[l], $_[o] } # FAUX, pourrait referencer 

# une variable globale 

Un constructeur ecrit de maniere plus robuste pourrait verifier que le fichier est 
accessible. Nous verifions d'abord que le fichier est lisible, comme nous ne souhai- 
tons pas ecraser la variable existante. (En d'autres termes, il ne faut pas supposer 
que l'utilisateur commence par ecrire dans le fichier. II pourrait garder precieuse- 
ment son ancien fichier camel.ide produit par une execution anterieure du pro- 
gramme.) Si nous ne pouvons pas ouvrir ou creer le fichier specifie, nous 
indiquons Ferreur gentiment en retournant undef et en affichant en option un 
avertissement avec carp. (Au lieu de cela nous pourrions moins gentiment faire un 
croak — c'est une affaire de gout.) Nous utilisons le pragma warnings pour deter- 
miner si l'utilisateur s'interesse ou non a notre avertissement : 
sub TIESCALAR { # dans FichierScalaire.pm 

my $classe = shift; 

my $nom_fichier = shift; 

my $hf; 

if (open $hf, "<", $nom_fichier or 
open $hf, ">", $nom_fichier) 

{ 

close $hf; 
$compteur++; 

return bless \$nom_fichier, $classe; 

} 

carp "Impossible de lier $nom_fichier : $!" if warnings: :enabled(); 
return; 

} 

Etant donne un tel constructeur, nous pouvons a present associer le scalaire 
$chaine au fichier camel.ide : 

tie ($chaine, "FichierScalaire", "camel.ide") or die; 
(Nous faisons encore des suppositions que nous ne devrions pas faire. Dans une ver- 
sion en production, nous n'ouvririons probablement qu'une fois le fichier, en rete- 
nant le handle de fichier ainsi que le fichier pour la duree de la liaison, et en 
gardant tout ce temps un verrouillage exclusif sur le handle a Faide de flock. Sans 
cela nous risquons des situations de concurrence (race conditions) — voir Gestion 
des problemes de synchronisation dans le chapitre 23, Securite.) 

S£LF->FETCH 

Cette methode est invoquee a chaque fois que vous accedez a une variable liee 
(c'est-a-dire, que vous la lisez). Elle ne prend pas de parametre hormis l'objet lie a la 
variable. Dans notre exemple, cet objet contient le nom de fichier : 
sub FETCH { 

my $self = shift; 

confess "He ne suis pas une methode de classe" unless ref $self; 
return unless open my $hf, $$self; 

read($hfj my $valeur, -s $hf); # NB: n'utilisez pas -s avec 

# les tubes ! 

return $valeur; 

} 
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Cette fois nous avons decide d'exploser (lever une exception) si FETCH recoit autre 
chose qu'une reference. (Soit elle etait invoquee comme methode de classe, soit 
quelqu'un Fa appelee par erreur en tant que fonction.) Nous n'avons pas d'autre 
moyen de retourner une erreur, done e'est probablement la reaction appropriee. 
En fait, Perl aurait de toute facon leve une exception des que nous aurions tente de 
dereferencer $self ; nous sommes simplement polis en utilisant confess pour 
deverser une trace arriere complete de la pile sur l'ecran de l'utilisateur. (Si Ton 
peut considerer cela poli.) 

Nous pouvons maintenant voir le contenu de camel.ide lorsque nous disons : 
tie($chaine, "FichierScalaire", "camel.ide"); 
print $chaine; 

SELF->STORE(VALEUR) 

Cette methode est executee lorsqu'une valeur est affectee a la variable liee. Le pre- 
mier parametre, SELF, est comme toujours Fobjet associe a la variable ; VALEUR est ce 
qui est affecte a la variable. (Nous utilisons le terme « affecte » au sens large — 
toute operation qui modifie la variable peut appeler STORE.) 
sub STORE { 

my($self ,$valeur) = @_; 

ref $self or confess "pas une methode de classe"; 

open my $hf, ">", $$self or croak "impossible d'ecraser $$self: $!"; 

syswrite($hf , $valeur) == length $valeur 

or croak "impossible d'ecrire dans $$self: $!"; 
close $hf or croak "impossible de fermer $$self: $!"; 

return $valeur; 

} 

Apres avoir « affecte » la nouvelle valeur, nous la retournons — car e'est ce que fait 
l'affectation. Si l'affectation n'a pas reussi, nous affichons l'erreur avec croak. Parmi 
les causes eventuelles d'echec : nous n'avions pas la permission d'ecrire dans le 
fichier associe, ou le disque s'est rempli, ou des malins genies ont infeste le contro- 
leur de disque. Parfois vous controlez la magie, et parfois e'est elle qui vous con- 
trole. 

Nous pouvons maintenant ecrire dans camel.ide en disant ceci : 
tie($chaine, "FichierScalaire", "camel.ide"); 
$chaine = "Voici la premiere ligne de camel. ide\n"; 
$chaine .= "Et voici une deuxieme ligne, rajoutee automatiquement.Xn"; 

SELF- >DESTR0Y 

Cette methode est declenchee lorsque Fobjet associe a la variable liee est sur le 
point d'etre recycle par le ramasse-miettes, au cas oil il devrait faire quelque chose 
de special pour nettoyer autour de lui. Comme pour les autres classes, cette 
methode est rarement necessaire, puisque Perl vous libere automatiquement la 
memoire de Fobjet moribond. Ici, nous definissons une methode DESTROY qui 
decremente notre compteur de fichiers lies : 
sub DESTROY { 

my $self = shift; 

confess "mauvais type" unless ref $self; 
$compteur--; 

} 
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Nous pourrions alors aussi fournir une methode de classe supplementaire pour 
recuperer la valeur courante du compteur. A vrai dire, elle ignore si elle est appelee 
comme methode de classe ou d'objet, mais vous n'avez plus d'objet apres le 
DESTROY, non ? 
sub count { 

# my $invoquant = shift; 

$compteur; 

} 

Vous pouvez l'appeler comme methode de classe a tout moment comme ceci : 
if (FichierScalaire->count) { 

warn "II reste des FichierScalaires lies quelque part...\n"; 

} 

C'est a peu pres tout ce qu'il y a a faire. A vrai dire, c'est plus que tout ce qu'il y a a faire, 
puisque nous avons fait quelques choses gentilles pour etre complets, robustes, et esthe- 
tiques (ou pas). II est certainement possible de faire des classes TIESCALAR plus simples. 

Variables compteur magiques 

Voici une classe Tie: : Counter simple, inspiree du module CPAN de meme nom. Les 
variables liees a cette classe s'incrementent de 1 a chaque fois qu'elles sont utilisees. Par 
exemple : 

tie my $compte "Tie: rCounter", 100; 

^tableau = qw /Rouge Vert Bleu/; 

for my $couleur (^tableau) { # Affiche : 

print " $compteur $couleur\n"; # 100 Rouge 
} # 101 Vert 

# 102 Bleu 

Le constructeur prend en option un parametre supplementaire specifiant la valeur ini- 
tiale du compteur, par defaut 0. L'affectation au compteur lui donne une nouvelle va- 
leur. Voici la classe : 

package Tie: :Counter; 

sub FETCH { ++ ${ $_[0] } } 

sub STORE { ${ $_[0] } = $_[1] } 

sub TIESCALAR { 

my ($classe, $valeur) = @_; 

$valeur = 0 unless defined $valeur; 

bless \$valeur => $classe; 

} 

1; # necessaire dans un module 

Vous voyez comme c'est court ? Nul besoin de beaucoup de code pour assembler une 
classe comme celle-ci. 

Bannir $_ par magie 

Cette classe de liaison curieusement exotique permet d'interdire les emplois non locali- 
ses de $_. Au lieu d'integrer un module avec use, qui invoque la methode import de la 
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classe, ce module doit etre charge avec no pour appeler la methode unimport rarement 
utilisee. L'utilisateur dit : 

no Souligne; 

Alors toutes les utilisations de $_ comme variable globale non localisee levent une ex- 
ception. 

Voici une suite de tests pour le module : 

#!/usr/bin/perl 
no Souligne; 
(ffltests = ( 

"Affectation" => sub { $_ = "Mai" }, 

"Lecture" => sub { print }, 

"Comparaison" => sub { $x = /mauvais/ }, 

"Chop" => sub { chop }, 

"Test fichier" => sub { -x }, 

"Emboite" => sub { for (1..3) { print } }, 

); 



while ( ($nom, $code) = splice(@testSj 0, 2) ) { 
print "Tester $nom : "; 
eval { &$code }; 

print $@ ? "detecte" : " rate !"; 
print "\n"; 

} 

qui affiche ce qui suit : 

Tester Affectation : detecte 
Tester Lecture : detecte 
Tester Comparaison : detecte 
Tester Chop : detecte 
Tester Test fichier : detecte 
Tester Emboite : 123 rate ! 

Ce dernier est « rate » parce qu'il est localise correctement par la boucle for et done sur 
d'acces. 

Voici le module curieusement exotique Souligne lui-meme. (Avons-nous mentionne 
qu'il est curieusement exotique ?) II fonctionne car la magie liee est de fait cachee par 
un local. Le module fait le tie dans son propre code d'initialisation pour le cas oil il 
serait appele par un require. 

package Souligne; 
use Carp; 

sub TIESCALAR { bless \my $toto => shift } 

sub FETCH { croak 'Acces en lecture a $_ interdit' } 

sub STORE { croak 'Acces en ecriture a $_ interdit' } 

sub unimport { tie($_, PACKAGE ) } 

sub import { untie $_ } 

tie($_, PACKAGE ) unless tied $_; 
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II est difficile de meler de maniere utile dans votre programme des appels a use et a no 
pour cette classe, car ils se produisent tous a la compilation, et non a l'execution. Vous 
pourriez appeler Souligne->import et Souligne->unimport directement, comme le 
font use et no. Mais normalement, pour vous permettre d'utiliser $_ librement, vous lui 
appliqueriez simplement local, ce qui est tout l'interet de la manipulation. 

Liaison de tableau 

Une classe qui implemente un tableau lie doit definir au moins les methodes TIEARRAY, 
FETCH, et STORE. II y a aussi beaucoup de methodes optionnelles : la methode DESTROY 
omnipresente, bien entendu, mais aussi les methodes STORESIZE et FETCHSIZE, qui don- 
nent acces a $#tableau et a scalar(@tableau). De plus, CLEAR est declenchee lorsque 
Perl doit vider un tableau, et EXTEND lorsque Perl aurait par avance alloue plus de me- 
moire pour un vrai tableau. 

Vous pouvez aussi definir les methodes POP, PUSH, SHIFT, UNSHIFT, SPLICE, DELETE, et EX- 
ISTS si vous voulez que les fonctions Perl correspondantes fonctionnent avec le tableau 
lie. La classe Tie : : Array peut servir de classe de base pour implementer les cinq premie- 
res de ces fonctions a partir de FETCH et de STORE. (L'implementation par defaut dans 
Tie: : Array de DELETE et de EXISTS appelle simplement croak.) Tant que vous definissez 
FETCH et STORE, le type de structure de donnees contenu par votre objet n'a pas d'impor- 
tance. 

D'un autre cote, la classe de base Tie: :StdArray (definie dans le module standard 
Tie : : Array module) fournit des methodes par defaut qui supposent que Fobjet con- 
tient un tableau ordinaire. Voici une simple classe de liaison de tableau qui en fait usa- 
ge. Parce qu'elle utilise Tie : : StdArray comme classe de base, seules sont a definir les 
methodes qui doivent etre traitees d'une maniere non standard. 

#!/usr/bin/perl 

package TableauHorloge; 

use Tie: :Array; 

our @ISA = 'Tie: : StdArray' ; 

sub FETCH { 

my($self ^emplacement) = @_; 

$self->[ $emplacement % 12 ]; 

} 

sub STORE { 

my($self ^emplacement, $valeur) = @>_; 
$self->[ $emplacement % 12 ] = $valeur; 

} 

package main; 

tie my (Stableau, 'TableauHorloge' ; 
^tableau = ( "a" ... "z" ); 
print "@tableau\n"; 

Lorsqu'il est execute, le programme affiche "yzopqrstuvw x". Cette classe 
implemente un tableau ne comportant que douze cases, comme les heures du cadran 
d'une horloge, numerotees de 0 a 11. Si vous demandez le 15 e element du tableau, vous 
obtenez en realite le 3 e . Vous pouvez voir la classe comme une aide pour les gens qui 
n'ont pas appris a lire l'heure sur une horloge a 24 heures. 
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Methodes de liaison de tableau 

C'etait la methode simple. Voyons maintenant les menus details. Pour illustrer notre 
propos, nous implementerons un tableau de taille limitee a la creation. Si vous tentez 
d'acceder a quelque chose au-dela de cette limite, une exception est levee. Par exemple : 

use TableauLimite; 

tie ^tableau, "TableauLimite", 2; 

$tableau[0] = "bon"; 
$tableau[l] = "bien"; 
$tableau[2] = "super"; 

$tableau[3] = "oula"; # Interdit : affiche un message d'erreur 

Le code en preambule de cette classe est le suivant : 

package TableauLimite; 
use Carp; 
use strict; 

Pour eviter de devoir definir SPLICE plus tard, nous l'heriterons de la classe Tie : : Array : 

use Tie: : Array; 

our @ISA = ("Tie:: Array"); 

NOM_CLASSE->JlEkRRkY(LISTE) 

En tant que constructeur de la classe, TIEARRAY doit retourner une reference consa- 
cree qui emulera le tableau lie. 

Dans cet exemple, juste pour vous montrer que vous ne devez pas necessairement 
retourner une reference de tableau, nous choisissons de representer notre objet 
avec une reference de hachage. Un hachage fonctionne bien comme type generique 
d'enregistrement : la valeur de la clef « LIMITE » du hachage stocke la limite maxi- 
male autorisee, et sa valeur « DONNEES » contient les donnees reelles. Si quelqu'un a 
l'exterieur de la classe tente de dereferencer l'objet retourne (en pensant sans doute 
qu'il s'agit d'une reference a un tableau), une exception est levee, 
sub TIEARRAY { 

my $classe = shift; 

my $limite = shift; 

confess "usage: tie(\@tableau, 'TableauLimite' , index_max)" 

if @_ | | $limite =~ /\D/; 
return bless { LIMITE => $limite, DONNEES =>[]}, $classe; 

} 

Maintenant nous pouvons dire : 

tie(@tableau, "TableauLimite", 3); # l'index maximum autorise est 3 
pour nous assurer que le tableau n'aura jamais plus de quatre elements. A chaque 
fois qu'un element du tableau est consulte ou enregistre, FETCH ou STORE sera appe- 
lee tout comme elle l'etait pour les scalaires, mais avec l'index en parametre supple- 
mentaire. 

SELF->F£JCH(INDEX) 

Cette methode est executee a chaque fois que Ton accede a un element du tableau 
lie. Elle prend un parametre apres l'objet : l'index de la valeur que nous tentons de 
recuperer. 
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sub FETCH { 

my ($self, $index) = 

if ($index > $self->{LIMITE}) { 

confess "Depassement de limite du tableau : 
$index > $self->{LIMITE}"j 

} 

return $self->{DONNEES}[$index]; 

} 

SELF- >ST0RE (INDEX, VALEUR) 

Cette methode est invoquee a chaque fois que Ton affecte une valeur a un element 
du tableau. Elle prend deux parametres apres l'objet : l'index de la case oil nous ten- 
tons de stocker quelque chose et la valeur que nous tentons d'y mettre. 
sub STORE { 

my($selfj $index, $valeur) = (5)_; 
if ($index > $self->{LIMITE} ) { 

confess "Depassement de limite du tableau : 
$index > $self->{LIMITE}"j 

} 

return $self->{DOI\INEES}[$index] = $valeur; 

} 

SELF- >DESTR0Y 

Perl appelle cette methode lorsque la variable liee doit etre detruite et sa memoire 
recuperee. Ceci n'est presque jamais utile dans un langage avec un ramasse-miettes, 
done cette fois-ci nous la laissons de cote. 

SE/.F->FETCHSIZE 

La methode FETCHSIZE devrait retourner le nombre total d'elements dans le 
tableau lie associe a SELF. C'est Fequivalent de scalar(@tableau), qui est habituel- 
lement egal a $#tableau + 1. 
sub FETCHSIZE { 

my $self = shift; 

return scalar @{$self->{DONNEES}}; 

} 

SELF- >ST0RESIZE(«0M6/?£) 

Cette methode specifie le NOMBRE total d'elements dans le tableau lie associe a SELF. 
Si le tableau retrecit, vous devez supprimer les elements au-dela de NOMBRE. Si le 
tableau grandit, vous devez vous assurer que les nouvelles positions sont indefinies. 
Dans notre classe TableauLimite, nous empechons aussi que le tableau ne gran- 
disse au-dela de la limite specifiee initialement. 
sub STORESIZE { 

my ($self, $nombre) = @_; 

if ($nombre > $self->{LIMITE}) { 

confess "Depassement de limite du tableau : 
$nombre > $self->{LIMITE}"; 

} 

$#{$self->{DONNEES}} = $nombre; 

} 
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SELF->EXTEW(NOMBRE) 

Perl se sert de la methode EXTEND pour indiquer que le tableau risque d'augmenter 
pour accommoder NOMBRE elements. Ainsi vous pouvez tout de suite allouer la 
memoire en un gros morceau au lieu de l'allouer plus tard et petit a petit avec de 
nombreux appels successifs. Comme notre Tableau Limite possede une taille limite 
fixe, nous ne definissons pas cette methode. 

S£/.F->EXISTS(IWD£X) 

Cette methode verifie l'existence dans le tableau lie de Felement situe a la position 
INDEX. Pour notre Tableau Limite, nous ne faisons qu'employer la fonction interne 
exists de Perl apres avoir verifie qu'il ne s'agit pas d'une tentative de regarder au- 
dela de la limite superieure fixee. 
sub EXISTS { 

my ($self, $index) = @_; 

if ($index > $self->{LIMITE}) { 

confess "Depassement de limite du tableau : 
$index > $self->{LIMITE}"; 

} 

exists $self->{DONNEES}[$index]; 

} 

SE/.F->DELETE(I«DEX) 

La methode DELETE supprime Felement a la position INDEX du tableau lie SELF. 
Dans notre classe Tableau Limite, la methode est presque identique a EXISTS, mais 
ceci n'est pas toujours le cas. 
sub DELETE { 

my ($self, $index) = @_; 

print STDERR "suppression !\n"; 

if ($index > $self->{LIMITE}) { 

confess "Depassement de limite du tableau : 
$index > $self->{LIMITE}"j 

} 

delete $self->{DONNEES}[$index]; 

} 

SELF- >CLEAR 

Cette methode est appelee lorsque le tableau doit etre vide. Cela se produit 
lorsqu'on affecte une liste de nouvelles valeurs (ou une liste vide) au tableau, mais 
pas lorsqu'il est soumis a la fonction undef. Comme un TableauLimite vide satisfait 
toujours la limite superieure, nous n'avons rien a verifier ici. 
sub CLEAR { 

my $self = shift; 

$self->{DONNEES} = []; 

} 

Si vous affectez une liste au tableau, CLEAR sera declenchee mais ne verra pas les 
valeurs de la liste. Done si vous passez outre la limite superieure ainsi : 

tie(@tableau, "TableauLimite", 2); 

@tableau = (l, 2, 3, 4); 
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la methode CLEAR retournera quand meme avec succes. L'exception ne sera levee 
que lors du STORE qui suit. L'affectation declenche un CLEAR et quatre STORE. 

SELF->P[)SH(LISTE) 

Cette methode ajoute les elements de LISTE a la fin du tableau. Voici a quoi elle 
pourrait ressembler pour notre classe TableauLimite : 
sub PUSH { 

my $self = shift; 

if (@_ + $#{$self->{DONNEES}} > $self->{LIMITE}) { 
confess "Tentative d'ajouter trop d'elements"; 

} 

push @{$self->{DONNEES}} J @_; 

} 

S£/.F->UNSHIFT(/.IST£) 

Cette methode insere les elements de LISTE au debut du tableau. Dans notre classe 
TableauLimite, la fonction ressemblerait a PUSH. 

SELF->P0P 

La methode POP enleve le dernier element du tableau et le retourne. Pour Tab- 
leauLimite, c'est une ligne : 

sub POP { my $self = shift; pop @{$self->{DONNEES}} } 
S£LF->SHIFT 

La methode SHIFT enleve le premier element de la liste et le retourne. Pour Tab- 
leauLimite, c'est similaire a POP 

SELF- >SPLICE (POSITION, LONGUEUR, LISTE) 

Cette methode vous permet d'episser (splice) le tableau SELF. Pour imiter la fonc- 
tion interne splice de Perl, POSITION devrait etre en option et zero par defaut, et 
compter en arriere a partir de la fin du tableau s'il est negatif. LONGUEUR devrait ega- 
lement etre en option, et par defaut la longueur du reste du tableau. LISTE peut 
etre vide. Si elle imite correctement la fonction interne, la methode retournera une 
liste des LONGUEUR elements a partir de POSITION (c'est-a-dire la liste des elements 
devant etre remplaces par LISTE). 

Comme l'epissage est une operation assez complexe, nous ne la definirons pas du 
tout; nous ne ferons qu'utiliser la fonction SPLICE du module Tie: :Array dont 
nous disposons sans rien faire en heritant de Tie : : Array. De cette maniere nous 
definissons SPLICE en fonction d'autres methodes de TableauLimite, et done la 
verification de limites aura tout de meme lieu. 

Ceci complete notre classe TableauLimite. Elle ne fait que legerement deformer la se- 
mantique des tableaux. Mais nous pouvons faire mieux, et plus court. 

Commodite de notation 

Une des choses bien avec les variables c'est qu'elles interpolent. Une des choses moins 
bien avec les fonctions c'est qu'elles ne le font pas. Vous pouvez utiliser un tableau lie 
pour faire une fonction qui peut etre interpolee. Supposons que vous vouliez interpoler 
des nombres aleatoires dans une chame. Vous pouvez juste dire : 
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#!/usr/bin/perl 

package InterpAleat; 

sub TIEARRAY { bless \my $self }; 

sub FETCH { int rand $_[l] }; 

package main; 

tie @rand, "InterpAleat"; 

for (1,10,100,1000) { 

print "Un entier aleatoire plus petit que $_ serait $rand[$_]\n"; 

} 

$rand[32] =5; # Cela va-t-il reformater notre disque systeme ? 

Lorsqu'il est execute, ce programme affiche : 

Un entier aleatoire plus petit que 1 serait 0 

Un entier aleatoire plus petit que 10 serait 5 

Un entier aleatoire plus petit que 100 serait 81 

Un entier aleatoire plus petit que 1000 serait 765 

Can't locate object method "STORE" via package "InterpAleat" at foo line 11. 

Comme vous le voyez, ce n'est pas si grave de ne pas avoir implemente STORE. Cela ex- 
plose simplement de facon normale. 

Liaison de hachage 

Une classe qui implemente un hachage lie doit definir huit methodes. TIEHASH cons- 
tant de nouveaux objets. FETCH et STORE donnent acces aux couples clef/valeur. EXISTS 
indique si une clef est presente ou non dans le hachage, et DELETE supprime une clef et 
sa valeur associee. 3 CLEAR vide le hachage en supprimant tous les couples clef/valeur. 
FIRSTKEY et NEXTKEY iterent sur les couples clef/valeur lorsque vous appelez keys, val- 
ues ou each. Et comme d'habitude, si vous voulez executer des actions specifiques lors- 
que l'objet est desalloue, vous pouvez definir une methode DESTROY. (Si ceci vous semble 
un grand nombre de methodes, vous n'avez pas lu avec attention la section precedente 
sur les tableaux. En tout cas, n'hesitez pas a heriter de methodes par defaut du module 
standard Tie:: Hash, en ne redefinissant que les methodes interessantes. Ici aussi, 
Tie: :StdHash s'attend a ce que l'implementation soit aussi un hachage.) 

Par exemple, supposons que vous vouliez creer un hachage pour lequel, a chaque fois 
que vous affectez une valeur a une clef, au lieu d'ecraser la valeur d'origine, la nouvelle 
valeur soit ajoutee a la fin d'un tableau de valeurs existantes. Comme cela lorsque vous 
dites : 

$h{$c} = "un"; 
$h{$c} = "deux"; 

Cela fait en realite : 

push @{ $h{$c} }, "un"; 
push @{ $h{$c} }, "deux"; 



3. Souvenez-vous que Perl distingue entre une clef absente du hachage et une clef presente dans 
le hachage mais ayant undef comme valeur associee. Les deux possibility's peuvent etre testees 
avec exists et defined, respectivement. 
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Cela n'est pas une idee tres compliquee, done vous devriez pouvoir employer un modu- 
le assez simple, ce que vous pouvez faire en utilisant Tie : : StdHash comme classe de ba- 
se. Voici une classe Tie: :HachageRajout qui fait precisement cela : 

package Tie: :HachageRajout; 
use Tie: :Hash; 

our @ISA = ("Tie::StdHash"); 
sub STORE { 

my ($self, $clef, $valeur) = @_; 

push @{$self->{$clef}} J $valeur; 

} 

i; 

Methodes de liaison de hachage 

Voici un exemple interessant de classe de liaison de hachage : elle vous donne un hacha- 
ge qui represente les « fichiers point » d'un utilisateur (e'est-a-dire les fichiers dont le 
nom commence avec un point, ce qui est une convention de nommage des fichiers de 
configuration sous Unix). Vous indexez dans le hachage avec le nom du fichier (sans le 
point) et vous recuperez le contenu du fichier point. Par exemple : 

use FichiersPoint; 

tie %dot, "FichiersPoint"; 

if ( $point{profile} =~ /MANPATH/ or 

$point{ login} =~ /MANPATH/ or 

$point{cshrc} =~ /MANPATH/ ) { 
print "il semble que vous specif iez votre MANPATHXn"; 

} 

Voici une autre maniere d'utiliser notre classe liee : 

# Le troisieme parametre est le nom de 1' utilisateur 

# dont nous examinerons les fichiers point, 
tie %lui, "FichiersPoint", "daemon"; 
foreach $f (keys %lui) { 

printf "le fichier point %s de daemon est de taille %d\n", $f, 
length $lui{$f}; 

} 

Dans notre exemple FichiersPoint nous implementons le hachage avec un hachage or- 
dinaire comportant plusieurs champs importants, dont seul le champ {CONTENU} con- 
tient ce que voit l'utilisateur comme son hachage. Voici les vrais champs de l'objet : 



Champ 


Contenu 


UTILISATEUR 


Celui dont l'objet represente les fichiers point. 


REPERTOIRE 


Oil se situent ces fichiers point. 


ECRASER 


Si l'on a le droit de modifier ou d'ecraser ces fichiers point. 


CONTENU 


Le hachage de couples nom de fichier point et contenu. 
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Void le debut de FichiersPoint.pm : 

package FichiersPoint; 
use Carp; 

sub quietaisje { (caller(l))[3] . "()" } 
my $DEBOGUAGE = 0; 

sub deboguage { $DEBOCUAGE = (S)_ ? shift : 1 } 

Dans notre exemple, nous voulons pouvoir declencher l'affichage de messages de debo- 
gage pendant le developpement de la classe, d'ou l'utilite de $DEBOGUAGE. Nous gardons 
aussi sous la main en interne une fonction pratique pour afficher les avertissements : 
quietaisje retourne le nom de la fonction ayant appele la fonction courante (la fonc- 
tion « grand-mere » de quietaisje). 

Voici les methodes pour le hachage lie FichiersPoint : 
NOM_CLASSE->TIEWSH(LISTE) 

Voici le constructeur de FichiersPoint : 
sub TIEHASH { 

my $self = shift; 

my $utilisateur = shift | | $>; 

my $rep_point = shift | | ""; 

croak "usage: @{[ Squietaisje ]} [UTILISATEUR [REP_P0INT] ] " if @_; 

$utilisateur = getpwuid($utilisateur) if $utilisateur =~ / A \d+$/; 
my $rep = (getpwnam($utilisateur)) [7] 

or croak "@{ [Squietaisje] }: pas d'utilisateur $utilisateur"; 
$rep .= "/$rep_point" if $rep_point; 



my $noeud = { 

UTILISATEUR => $utilisateur, 
REPERTOIRE => $rep, 
CONTENU => {}, 
ECRASER => 0, 



opendir REP, $rep 

or croak "@{[&quietaisje]}: impossible d'ouvrir $rep: $!"; 
for my $point ( grep / A \./ && -f "$rep/$_", readdir(REP)) { 

$point =~ s/ A \.//; 

$noeud->{CONTEI\IU}{$point} = undef; 

} 

closedir REP; 

return bless $noeud, $self; 

} 

Cela vaut sans doute la peine de mentionner que si vous allez appliquer des tests de 
fichier sur les valeurs retournees par le readdir ci-dessus, vous avez interet a les pre- 
fixer avec le repertoire concerne (comme nous le faisons). Sans quoi, en l'absence 
d'un chdir, vous risqueriez de ne pas tester le bon fichier. 
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SELF- > FETCH (CIFF) 

Cette methode implemente la lecture d'un element du hachage lie. Elle prend un 
parametre apres l'objet : la clef dont nous tentons de recuperer la valeur. Cette clef 
est une chaine, et vous pouvez faire ce que vous voulez avec (qui soit coherent avec 
sa nature de chaine). 

Voici le fetch de notre exemple FichiersPoint : 
sub FETCH { 

carp &quietaisje if $DEBOGUAGE; 

my $self = shift; 

my $point = shift; 

my $rep = $self->{REPERTOIRE}; 

my $fichier = "$rep/.$point"; 

unless (exists $self->{CONTENU}->{$point} | | -f $fichier) { 

carp "@{[&quietaisje]}: pas de fichier $point" if $DEBOGUAGE; 
return undef; 

} 

# Implementer un cache. 

if (defined $self->{CONTENU}->{$point}) { 

return $self->{CONTENU}->{$point}; 
} else { 

return $self->{CONTENU}->{$point} = ~cat $rep/.$point s ; 

} 

} 

Nous avons un peu triche en executant la commande Unix caf(l), mais il serait plus 
portable (et plus efficace) d'ouvrir le fichier nous-memes. D'un autre cote, comme 
les fichiers point sont un concept unixien, nous ne sommes pas tellement concer- 
ned. Ou nous ne devrions pas l'etre. Ou quelque chose comme ca... 

SELF-> STOR E(CLEF, VALEUR ) 

Cette methode fait ce qu'il faut lorsqu'un element du hachage lie est modifie 
(ecrit). Elle prend deux parametres apres l'objet : la clef sous laquelle nous stockons 
la nouvelle valeur, et la valeur elle-meme. 

Dans notre exemple FichiersPoint, nous ne permettons pas a un utilisateur 
d'ecrire un fichier sans d'abord invoquer la methode ecraser sur l'objet d'origine 
retourne par tie : 
sub STORE { 

carp &quietaisje if $DEBOGUAGE; 

my $self = shift; 

my $point = shift; 

my $valeur = shift; 

my $fichier = $self->{REPERTOIRE} . "/.$point"; 
croak "@{[&quietaisje]}: $fichier non ecrasable" 

unless $self->{ECRASER}; 
open(Fj "> $fichier") or croak "impossible d'ouvrir $fichier: $!"; 
print F $valeur; 
close(F); 

} 
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Si quelqu'un souhaite ecraser quelque chose, il peut dire : 
$ob = tie %points_daemon, "daemon"; 
$ob->ecraser(l); 

$points_daemon{signature} = "Un vrai demon\n"; 
Mais il pourrait egalement modifier {ECRASER} a l'aide de tied : 

tie %points_daemon, "FichiersPoint" , "daemon"; 

tied(%points_daemon)->ecraser(l); 
ou en une instruction : 

(tie %points_daemon, "FichiersPoint" , "daemon")->ecraser(l); 
La methode ecraser est simplement : 

sub ecraser { 

my $self = shift; 

$self->{ECRASER} = @_ ? shift : 1; 

} 

SELF->DELE1E(CLEF) 

Cette methode traite les tentatives de suppression d'un element du hachage. Si 
votre hachage emule utilise quelque part un vrai hachage, vous pouvez simple- 
ment appeler le vrai delete. De nouveau, nous prenons la precaution de verifier 
que Putilisateur souhaite reellement ecraser des fichiers : 
sub DELETE { 

carp &quietaisje if $DEBOGUAGE; 

my $self = shift; 

my $point = shift; 

my $fichier = $self->{REPERTOIRE} . "/.$point"; 

croak "@{[&quietaisje]}: ne supprime pas le fichier $fichier" 

unless $self->{ECRASER}; 
delete $self->{CONTENU}->{$point}; 
unlink $fichier or carp "@{[&quietaisje]}: 

impossible de supprimer $fichier: $!"; 

} 

S£LF->CLEAR 

Cette methode est executee lorsque le hachage entier doit etre vide, habituellement 
en lui affectant la liste vide. Dans notre exemple, cela supprimerait tous les fichiers 
point de l'utilisateur ! C'est une chose tellement dangereuse que nous exigerons 
que ECRASER soit superieur a 1 avant que cela ne puisse se produire : 
sub CLEAR { 

carp &quietaisje if $DEBOGUAGE; 

my $self = shift; 

croak "@{[&quietaisje]}: ne supprime pas tous les fichiers point 
de $self->{UTILISATEUR}" 

unless $self->{ECRASER} > 1; 
for my $point ( keys %{$self->{CONTENU}}) { 

$self->DELETE($point); 

} 

} 
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SELF->EXIS1S(CLEF) 

Cette methode est executee lorsque Futilisateur invoque la fonction exists sur un 
hachage donne. Dans notre exemple, nous examinons le hachage {CONTENU} pour 
trouver la reponse : 
sub EXISTS { 

carp &quietaisje if $DEBOGUAGE; 

my $self = shift; 

my $point = shift; 

return exists $self->{CONTENU}->{$point}; 

} 

S£/.F->FIRSTKEY 

Cette methode est appelee lorsque l'utilisateur commence a iterer sur le hachage, 
comme lors d'un appel a keys, values ou each. En appelant keys dans un contexte 
scalaire, nous reinitialisons son etat interne pour nous assurer que le prochain each 
utilise dans l'instruction return obtiendra bien la premiere clef, 
sub FIRSTKEY { 

carp Squietaisje if $DEBOGUAGE; 

my $self = shift; 

my $temp = keys %{$self->{CONTENU}}; 
return scalar each %{$self->{CONTENU}}; 

} 

SELF->NEXTKEY(CLEF_PRECEDENTE) 

Cette methode est Fiterateur d'une fonction keys, values ou each. 
CLEF_PRECEDENTE est la derniere clef a laquelle on a accede, ce que sait fournir Perl. 
Ceci est utile si la methode NEXTKEY doit connaitre l'etat precedent pour calculer 
l'etat suivant. 

Dans notre exemple, nous utilisons un vrai hachage pour representer les donnees 
du hachage lie, a ceci pres que ce hachage est stocke dans le champ CONTENU du 
hachage plutot que dans le hachage lui-meme. Done nous pouvons compter sur 
Foperateur each de Perl : 
sub NEXTKEY { 

carp &quietaisje if $DEBOGUAGE; 

my $self = shift; 

return scalar each %{ $self->{CONTENU} } 

} 

SELF- >DESTR0Y 

Cette methode est declenchee lorsque l'objet du hachage lie est sur le point d'etre 
desalloue. Elle n'est vraiment utile que pour le debogage et le nettoyage. En voici 
une version tres simple : 
sub DESTROY { 

carp &quietaisje if $DEBOGUAGE; 

} 

Maintenant que nous vous avons donne toutes ces methodes, voici un exercice a faire a 
la maison : reprendre tout par le debut, trouver les endroits ou nous avons interpole 
@{[&quietaisje]}, et les remplacer par un simple scalaire lie nomme $quietaisje qui 
fait la meme chose. 
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Liaison de handle de fichier 

Une classe qui implemente un handle de fichier lie doit definir les methodes suivantes : 
TIEHANDLE, et l'une au moins de PRINT, PRINTF, WRITE, READLINE, CETC, ou READ. La classe 
peut egalement fournir une methode DESTROY, et la definition des methodes BINMODE, 
OPEN, CLOSE, EOF, FILENO, SEEK, TELL, READ et WRITE permet au handle de fichier lie 
d'emuler les fonctions internes Perl correspondantes. (Enfin, ce n'est pas tout a fait vrai : 
WRITE correspond a syswrite et n'a rien a voir avec la fonction Perl interne write, qui 
fait de l'affichage a l'aide de declarations format.) 

Les handles de fichier lies sont particulierement utiles lorsque Perl est integre dans un 
autre programme (comme Apache ou vi) et que l'affichage par STDOUT ou STDERR doit 
etre redirige de maniere speciale. 

Mais il n'est en fait meme pas necessaire que les handles de fichier soient lies a un fi- 
chier. Vous pouvez utiliser des instructions de sortie pour construire une structure de 
donnees en memoire, et des instructions d'entree pour la recuperer. Voici une maniere 
simple d'inverser une serie d'instructions print et printf sans inverser chaque ligne : 

package InversePrint; 
use strict; 
sub TIEHANDLE { 

my $classe = shift; 

bless [], $classe; 

} 

sub PRINT { 

my $self = shift; 

push @$self, join @_; 

} 

sub PRINTF { 

my $self = shift; 

my $fmt = shift; 

push @$self, sprintf $fmt, @_; 

} 

sub READLINE { 

my $self = shift; 
pop @$self; 

} 

package main; 

my $m = "--M0RE--\n"; 

tie *INV, "InversePrint"; 

# Faire des print et des printf. 

print INV "Le juge blond est soudainement tres malade.$m"; 

printf INV <<"END", int rand 10000000; 
Portez %d vieux whiskys 
au juge blond qui fume ! 
END 
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print INV «"END"; 
Portez ce vieux whisky 
au juge blond qui fume. 
END 

# Maintenant on lit a partir du meme handle, 
print while <INV>; 

Ceci affiche : 

Portez ce vieux whisky 
au juge blond qui fume. 
Portez 7387770 vieux whiskys 
au juge blond qui fume ! 

Le juge blond est soudainement tres malade. --M0RE-- 

Methodes de liaison de handle defichier 

Pour notre exemple detaille, nous creerons un handle de fichier qui met en majuscules 
les chames qui lui sont soumises. Pour nous amuser un peu, nous ferons commencer le 
fichier avec <CRIER> lorsqu'il est ouvert, et nous le fermerons avec </CRIER> lorsqu'il est 
ferme. Comme ca nous pourrons divaguer en XML bien forme. 

Voici le debut du fichier Crier.pm qui implemente la classe : 

package Crier; 

use Carp; # Pour pouvoir signaler les erreurs avec croak 

Listons a present les definitions de methode de Crier.pm. 

NOM_CLASSE->JIEHMiDLE(LISTE) 

Ceci est le constructeur de la classe, qui comme d'habitude doit retourner une refe- 
rence consacree : 
sub TIEHANDLE { 

my $classe = shift; 

my $forme = shift; 

open my $self, $forme, @_ or croak "impossible d'ouvrir $forme(5>_: 

$!"; 

if ($forme =~ />/) { 

print $self "<CRIER>\n"; 

$$self->{ECRITURE} =1; # Se souvenir d'ecrire la balise 

#de fin 

} 

return bless $self, $classe; # $self est une reference de glob 

} 

Ici, nous ouvrons un nouveau handle de fichier selon le mode et le nom de fichier 
passes a l'operateur tie, nous ecrivons <CRIER> dans le fichier, et nous retournons 
une reference consacree. II se passe beaucoup de choses dans cette instruction open, 
mais nous indiquerons simplement que, en plus de l'idiome habituel « open or 
die », le my $self passe un scalaire non defini a open, qui sait comment l'autovivi- 
fier en un typeglob. Sa nature de typeglob est egalement interessante, car le type- 
glob contient non seulement le veritable objet entree/sortie du fichier, mais aussi 
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diverses autres structures de donnees pratiques, comme un scalaire ($$$self ), un 
tableau (@$$self ), et un hachage (%$$self ). (Nous ne mentionnerons pas la fonc- 
tion, &$$self.) 

La $forme est un parametre indiquant soit le nom de fichier, soit le mode. Si c'est 
un nom de fichier, @_ est vide, done cela se comporte comme un open a deux para- 
metres. Autrement, $f orme est le mode pour les parametres restants. 
Apres l'ouverture, nous faisons un test pour determiner si nous devons ecrire la 
balise ouvrante, auquel cas nous le faisons. Et immediatement nous utilisons une 
de ces structures de donnees susmentionnees. Ce $$self->{ECRITURE} est un exem- 
ple d'utilisation du glob pour stacker une information interessante. Dans ce cas, 
nous retenons si nous avons ecrit la balise ouvrante afin de savoir si nous devons 
ecrire la balise fermante correspondante. Nous utilisons le hachage %$$self, done 
nous pouvons donner au champ un nom comprehensible. Nous aurions pu utiliser 
le scalaire $$$self, mais une telle utilisation ne se documenterait pas elle-meme. 
(Ou elle ne ferait que se documenter elle-meme, selon votre point de vue.) 

SELF->PRim(LISTE) 

Cette methode implemente le print sur le handle lie. La LISTE contient ce qui a ete 
passe a print. Notre methode ci-dessous met en majuscules chaque element de la 
LISTE : 

sub PRINT { 

my $self = shift; 

print $self map {uc} @_; 

} 

SE/.F- >READLINE 

Cette methode fournit les donnees lorsque le handle de fichier est lu avec l'opera- 
teur angle (<HF>) ou avec readline. La methode doit retourner undef lorsqu'il n'y a 
plus de donnees. 
sub READLINE { 

my $self = shift; 

return <$self>; 

} 

Ici, nous faisons simplement return <$self> pour que la methode se comporte 
correctement selon qu'elle est appelee en contexte scalaire ou en contexte de liste. 

SELF- >GETC 

Cette methode s'execute a chaque fois qu'est appelee getc sur le handle de fichier 
lie. 

sub GETC { 

my $self = shift; 
return getc($self); 

} 

Comme plusieurs des methodes dans notre classe Crier, la methode GETC ne fait 
qu'appeler sa fonction interne Perl correspondante et retourner le resultat. 

SELF->OPEN(LISTE) 

Notre methode TIEHANDLE ouvre elle-meme le fichier, mais un programme qui uti- 
lise la classe Crier et appelle ensuite open declenche cette methode. 
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sub OPEN { 

my $self = shift; 
my $forme = shift; 
my $nom = "$forme@_"; 
$self->CLOSE; 

open($self, $forme, @_) or croak "impossible de rouvrir $nom: $!"; 
if ($forme =~ />/) { 

print $self "<CRIER>\n" or croak "impossible de commencer 

le print: $!"; 

$$self->{ECRITURE} = 1; # Se souvenir d'ecrire la balise de fin 

} 

else { 

$$self->{ECRITURE} = 0; # Se souvenir de ne pas ecrire 
# la balise de fin 

} 

return 1; 

} 

Nous invoquons notre propre methode CLOSE pour fermer le fichier explicitement 
au cas ou l'utilisateur ne se serait pas soucie de le faire lui-meme. Ensuite nous 
ouvrons un nouveau fichier avec le nom de fichier specifie dans le open, et nous 
crions dedans. 

SEZ.F->CLOSE 

Cette methode gere les requetes de fermeture du handle. Ici, nous faisons un seek 
jusqu'a la fin du fichier et, s'il reussit, nous affichons </CRIER> avant d'appeler le 
close interne de Perl, 
sub CLOSE { 

my $self = shift; 

if ($$self->{ECRITURE}) { 

$self->SEEK(0, 2) or return; 

$self->PRINT("</CRIER>\n") or return; 

} 

return close $self; 

} 

SELF->SEEK(LISTE) 

Lorsque vous faites un seek sur un handle de fichier lie, la methode SEEK est appe- 
lee. 

sub SEEK { 

my $self = shift; 

my ($position, $depart) = @_; 

return seek($self, $position, $depart); 

} 

SELF->lEli 

Cette methode est invoquee lorsque tell est appelee sur le handle de fichier lie. 
sub TELL { 

my $self = shift; 
return tell $self; 

} 
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SELF->PRW1F(LISTE) 

Cette methode est executee lorsque printf est appelee sur le handle de fichier lie. 
La LISTE contient le format et les elements a afficher. 
sub PRINTF { 

my $self = shift; 

my $format = shift; 

return $self->PRINT(sprintf $format, @_); 

} 

Ici, nous employons sprintf pour produire la chame formatee et nous la passons a 
PRINT pour la mise en majuscules. Mais rien ne vous oblige a utiliser la fonction 
interne sprintf. Vous pourriez interpreter les codes pour-cent a votre maniere. 

SELF->REM)(LISTE) 

Cette methode repond lorsque le handle est lu avec read ou sysread. Notez que 
nous modifions le premier parametre de LISTE « sur place », imitant comment 
read peut remplir le scalaire fourni comme deuxieme parametre. 
sub READ { 

my ($self, undef, $taille, $position) = (5>_; 
my $ref_tampon = \$_[l]; 

return read($self, $$ref_tampon, $taille, $position); 

} 

SELF->WITE(LISTE) 

Cette methode est invoquee lorsqu'on ecrit au handle avec syswrite. Ici, nous met- 
tons en majuscules la chame ecrite. 
sub WRITE { 

my $self = shift; 

my $chaine = uc(shift); 

my $taille = shift | | length $chaine; 

my $position = shift | | 0; 

return syswrite $self, $chaine, $taille, $position; 

} 

S£/.F->E0F 

Cette methode retourne une valeur booleenne lorsque Fetat fin-de-fichier du han- 
dle de fichier lie a la classe Crier est teste avec eof. 
sub EOF { 

my $self = shift; 

return eof $self; 

} 

SELF- >BINM0DE (DISC) 

Cette methode indique la discipline entree/sortie qui doit etre utilisee sur le handle 
de fichier. Si rien n'est specifie, elle met le handle de fichier en mode binaire (la dis- 
cipline : raw), pour les systemes de fichiers qui distinguent entre les fichiers texte et 
les fichiers binaires. 
sub BINMODE { 

my $self = shift; 

my $disc = shift | | ":raw"; 



360 



Chapitre 14 — Variables lie.es 



return binmode $self, $disc; 

} 

Voila comment vous l'ecririez, mais die est en fait inutilisable dans notre cas car 
open a deja ecrit sur le handle. Done nous devrions probablement lui faire dire : 
sub BINMODE { croak("Trop tard pour utiliser binmode") } 
S£/.F->FILEN0 

Cette methode doit retourner le descripteur de fichier (f ileno) associe au handle 
de fichier par le systeme d'exploitation. 

sub FILENO { 

my $self = shift; 
return fileno $self; 

} 

SELF- >DESTR0Y 

Comme pour les autres types de liaison, cette methode est declenchee lorsque 
l'objet lie est sur le point d'etre detruit. Ceci est utile pour permettre a l'objet de 
faire du nettoyage. Ici, nous nous assurons que le fichier est ferme, au cas oil le pro- 
gramme aurait oublie d'appeler close. Nous pourrions simplement dire close 
$self, mais il est preferable d'invoquer la methode CLOSE de la classe. De cette 
maniere si le concepteur de la classe decide de modifier la facon dont les fichiers 
sont fermes, cette methode DESTROY n'a pas a etre modifiee. 
sub DESTROY { 

my $self = shift; 

$self->CLOSE; # Fermer le fichier avec la methode CLOSE de Crier 

} 

Voici une demonstration de notre classe Crier : 

#!/usr/bin/perl 
use Crier; 

tie(*F00, Crier::, ">nom_fichier"); 

print F00 "bonjour\n"; # Affiche BONDOUR. 

seek F00, 0, 0; # Repart du debut. 

(Slines = <F00>; # Appelle la methode READLINE. 

close F00; # Ferme le fichier explicitement. 

open(F00, "+<", "nom_fichier"); # Rouvre F00, appelant OPEN. 

seek(F00, 8, 0); # Saute "<CRIER>\n". 

sysread(F00j $tampon, 7); # Lit 7 octets de F00 dans $tampon. 

print "trouve $tampon\n"; # Devrait afficher "BONDOUR" . 

seek(F00j -7, l); # Recule par-dessus "bonjour". 

syswrite^FOO, "ciaolXn", 6); # Ecrit 6 octets dans F00. 

untie(*F00); # Appelle la methode CLOSE implicitement. 

Apres l'execution de ceci, le fichier contient : 

<CRIER> 

CIAO! 

</CRIER> 

Voici d'autres choses etranges et merveilleuses a faire avec le glob interne. Nous em- 
ployons le mime hachage que precedemment, mais avec les nouvelles clefs 
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CHEMIN_FICHIER et DEBOCUAGE. D'abord nous installons une surcharge de conversion en 
chaine pour que l'affichage de nos objets revele le nom de fichier (voir le chapitre 13, 
Surcharge) : 

# Ceci est vraiment trop genial ! 

use overload q("") => sub { $_[o]->chemin_fichier }; 

# Ceci doit etre mis dans chaque fonction que vous voulez tracer, 
sub trace { 

my $self = shift; 

local $Carp: :CarpLevel = 1; 

Carp: :cluck("\nmethode magique trace") if $self->deboguage; 



# Handler de surcharge pour afficher le chemin d'acces au fichier. 
sub chemin_fichier { 

my $self = shift; 

confess "je ne suis pas une methode de classe" unless ref $self; 
$$self->{CHEMIN_FICHIER} = shift if @_; 
return $$self->{CHEMII\l_FICHIER}; 

} 

# Deux modes, 
sub deboguage { 

my $self = shift; 

my $var = ref $self ? \$$self->{DEBOGUAGE} : \our $Deboguage; 
$$var = shift if @_; 

return ref $self ? $$self->{DEBOGUAGE} | | $Deboguage : $Deboguage; 

} 

Ensuite nous appelons trace a Fentree de toutes nos methodes ordinaires, comme ceci : 

sub GETC { $_[0]->trace; # NOUVEAU 

my($self) = @_; 
getc($self); 

} 

Nous stockons le chemin d'acces du fichier dans les methodes TIEHANDLE et OPEN : 

sub TIEHANDLE { 

my $classe = shift; 
my $forme = shift; 

my $nom = "$forme@_"; # NOUVEAU 

open my $self, $forme, (5>_ or croak "impossible d'ouvrir $nom : $!"; 
if ($forme =~ />/) { 

print $self "<CRIER>\n"; 

$$self->{ECRITURE} =1; # Se souvenir d'ecrire la balise de fin 

} 

bless $ s elf j $classe; # $self est une reference de glob 

$self->chemin_fichier($nom); # NOUVEAU 
return $self; 



sub OPEN { $_[0]->trace; # NOUVEAU 
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my $self = shift; 
my $forme = shift; 
my $nom = "$forme@_"; 
$self->CLOSE; 

open($self, $forme, @>_) or croak "impossible de rouvrir $nom : $!"; 
$self->chemin_fichier($nom); # NOUVEAU 
if ($forme =~ />/) { 

print $self "<CRIER>\n" or croak "impossible de commencer 

le print : $!"; 

$$self->{ECRITURE} =1; # Se souvenir d'ecrire la balise de fin 

} 

else { 

$$self->{ECRITURE} =0; # Se souvenir de ne pas ecrire la 

# balise de fin 

} 

return 1; 

} 

II faut aussi appeler $self->deboguage(l) quelque part pour demarrer le debogage. 
Lorsque nous faisons cela, tous les appels a Carp : : cluck produiront des messages infor- 
matifs. En voici un que nous obtenons pendant la reouverture ci-dessus. II nous situe a 
trois niveaux de profondeur d'appels de methode, alors que nous fermons Fancien fi- 
chier en preparation pour Fouverture du nouveau : 

methode magique trace at foo line 87 

Crier: : SEEK( '>nom_f ichier' , '>nom_fichier' , 0, 2) called at foo line 81 
Crier: :CLOSE( J >nom_fichier') called at foo line 65 

Crier: :OPEI\l('>nom_fichier' , '+<', 'nom_f ichier' ) called at foo line 141 

Handles defichier originaux 

Vous pouvez lier un meme handle de fichier a l'entree et a la sortie d'un tube (pipe) a 
deux bouts. Supposons que vous vouliez executer le programme bc(l) (calculateur a 
precision arbitraire) de cette maniere : 

use Tie: :0pen2; 

tie *CALC, J Tie::0pen2 J , "be -1"; 
$somme = 2; 
for (1 .. 7) { 

print CALC "$somme * $somme\n"; 

$somme = <CALC>; 

print "$_: $somme"; 

chomp $somme; 

} 

close CALC; 

Vous vous attendriez a ce qu'il affiche ceci : 

l: 4 
2: 16 
3: 256 
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4: 65536 

5: 4294967296 

6: 18446744073709551616 

7 : 340282366920938463463374607431768211456 

Vous auriez raison de vous attendre a cela si vous aviez le programme bc(l) sur votre or- 
dinateur, et si vous aviez defini Tie : : 0pen2 de la maniere suivante. Cette fois-ci nous uti- 
liserons un tableau consacre comme objet interne. II contient nos deux handles de 
fichier pour la lecture et pour l'ecriture. (La tache difficile d'ouverture d'un tube a deux 
bouts est faite par IPC: :0pen2 ; nous ne faisons que la partie amusante.) 

package Tie: :0pen2; 
use strict; 
use Carp; 

use Tie: :Handle; # ne pas heriter de ceci ! 
use IPC: :0pen2; 

sub TIEHANDLE { 

my ($classe, @cmd) = @_; 
no warnings 'once'; 

my @paire_hf = \do { local(*LECTURE, *ECRITURE) }; 
bless $_, 'Tie: :StdHandle' for @paire_hf; 
bless(\(5)paire_hf => $classe)->OPEN(@cmd) || die; 
return \@paire_hf ; 



sub FILENO { 

my $self = shift; 

[ map { fileno $self->[$_] } 0,1 ]; 

} 

for my $meth_sortie ( qw(PRINT PRINTF WRITE) ) { 
no strict 'refs'; 
*$meth_sortie = sub { 
my $self = shift; 



} 



sub 



OPEN { 

my ($self, @cmd) = @_; 

$self->CLOSE if grep {defined} @{ $self->FILENO }; 
open2(@$self , @cmd); 



} 



$self-> [1] ->$meth_sortie(|5>_) ; 



} 



for 



my $meth_entree ( qw(READ READLINE GETC) ) { 
no strict J refs'; 
*$meth_entree = sub { 



my $self = shift; 



$self-> [0] ->$meth_entree(|5)_) ; 



} 
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for my $meth_double ( qw(BINMODE CLOSE EOF)) { 
no strict J refs J ; 
*$meth_double = sub { 
my $self = shift; 

$self->[o]->$meth_double(@_) && $self->[l]->$meth_double((5)_); 

}; 

} 

for my $meth_morte ( qw(SEEK TELL)) { 
no strict J refs J ; 
*$meth_morte = sub { 

croak( "impossible d'appliquer $meth_morte a un tube"); 

}; 

} 

i; 

Les quatre dernieres boucles sont incroyablement chouettes, a notre avis. Pour une ex- 
plication de ce qui se passe, voir la section Fermetures comme modeles de fonctions au cha- 
pitre 8. 

Voici un ensemble de classes encore plus bizarres. Les noms de paquetages devraient 
vous donner une idee de ce qu'elles font : 

use strict; 

package Tie: :DevNull; 

sub TIEHANDLE { 

my $classe = shift; 
my $hf = local *HF; 
bless \$hf, $classe; 

} 

for (qw(READ READLINE GETC PRINT PRINTF WRITE)) { 
no strict 'refs'; 
*$_ = sub { return }; 

} 

package Tie: :DevAleatoire; 

sub READLINE { randQ . "\n"; } 
sub TIEHANDLE { 

my $classe = shift; 

my $hf = local *HF; 

bless \$hf, $classe; 

} 

sub FETCH { randQ } 
sub TIESCALAR { 

my $classe = shift; 

bless \my $self, $classe; 

} 

package Tie: :Tee; 
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sub TIEHANDLE { 

my $classe = shift; 

my (Shandies; 

for my $chemin (@_) { 

open(my $hf, ">$chemin") | | die "impossible d'ecrire $chemin"; 

push (Shandies, $hf; 

} 

bless \@handles, $classe; 

} 

sub PRINT { 

my $self = shift; 
my $ok = 0; 
for my $hf (@$self) { 
$ok += print $hf @_; 

} 

return $ok == @$self; 

} 

La classe Tie : : Tee emule le programme standard Unix tee{\) qui envoie un flux en sor- 
tie vers plusieurs differentes destinations. La classe Tie : : DevNull emule le peripherique 
nul /dev/null des systemes Unix. La classe Tie: :DevRandom produit des nombres alea- 
toires soit comme handle, soit comme scalaire, selon que vous appelez TIEHANDLE ou 
TIESCALAR ! Voici comment vous les appelez : 

package main; 

tie *DISPERSE, "Tie::Tee", qw(tmpl - tmp2 >tmp3 tmp4); 

tie *ALEATOIRE, "Tie: :DevAleatoire"; 

tie *NULL, "Tie: : DevNull"; 

tie my $alea, "Tie: :DevAleatoire"; 

for my $i (l. .10) { 

my $ligne = <ALEATOIRE>; 
chomp $ligne; 

for my $hf (*NULL, *DISPERSE) { 
print $hf "$i: $ligne $alea\n"; 

} 

} 

Ce qui produit quelque chose comme ceci sur votre ecran : 

1: 0.124115571686165 0.20872819474074 
2: 0.156618299751194 0.678171662366353 
3: 0.799749050426126 0.300184963960792 
4: 0.599474551447884 0.213935286029916 
5: 0.700232143543861 0.800773751296671 
6: 0.201203608274334 0.0654303290639575 
7: 0.605381294683365 0.718162304090487 
8: 0.452976481105495 0.574026269121667 
9: 0.736819876983848 0.391737610662044 
10: 0.518606540417331 0.381805078272308 
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Mais ce n'est pas tout ! Le programme a ecrit sur votre ecran a cause du - dans le tie de 
*DISPERSE ci-dessus. Mais cette ligne lui a egalement dit de creer les fichiers tmpl, tmp2, 
et tmp4, et d'ajouter a la fin de tmp3. (Nous avons aussi ecrit au handle de fichier *NULL 
dans la boucle, mais bien sur cela n'est apparu nulle part d'interessant, a moins que vous 
vous interessiez aux trous noirs.) 

Un piege subtil du deliement 

Si vous avez l'intention de vous servir de Fobjet retourne par tie ou par tied, et que la 
classe definit un destructeur, il y a un piege subtil contre lequel vous devez vous prote- 
ger. Examinez cet exemple (tordu, avouons-le) d'une classe qui utilise un fichier pour 
tenir un log de toutes les valeurs affectees a un scalaire : 

package Souvenir; 

sub TIESCALAR { 

my $classe = shift; 

my $nom_fichier = shift; 

open(my $handle, ">", $nom_f ichier) 

or die "Impossible d'ouvrir $nom_f ichier : $!\n"; 
print $handle "Le Debut\n"; 
bless {HF => $handle, VALEUR => 0}, $classe; 

} 

sub FETCH { 

my $self = shift; 
return $self->{VALEUR}; 

} 

sub STORE { 

my $self = shift; 

my $valeur = shift; 

my $handle = $self->{HF}; 

print $handle "$valeur\n"; 

$self->{VALEUR} = $valeur; 

} 

sub DESTROY { 

my $self = shift; 
my $handle = $self->{HF}; 
print $handle "La Fin\n"; 
close $handle; 

} 

i; 

Voici un exemple qui se sert de notre classe Souvenir : 

use strict; 
use Souvenir; 
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my $fred; 

tie $fred, "Souvenir", "chameau.log"; 
$fred = 1; 
$fred = 4; 
$fred = 5; 
untie $fred; 

system "cat chameau.log"; 

Void ce qu'il affiche lorsqu'il est execute : 

Le Debut 

l 

4 

5 

La Fin 

Jusqu'ici tout va bien. Rajoutons une methode supplementaire a la classe Souvenir qui 
permet les commentaires dans le fichier — disons, quelque chose comme ceci : 

sub commenter { 

my $self = shift; 
my $message = shift; 

print { $self->{HF} } $handle $message, "\n"; 

} 

Et voici l'exemple precedent, modifie pour utiliser la methode commenter : 

use strict; 
use Souvenir; 

my ($fredj $x); 

$x = tie $fred, "Souvenir", "chameau.log"; 
$fred = 1; 
$fred = 4; 

commenter $x "change..."; 
$fred = 5; 
untie $fred; 

system "cat chameau.log"; 

Maintenant le fichier risque d'etre vide ou incomplet, ce qui n'est probablement pas ce 
que vous souhaitiez faire. Voici pourquoi. Lier une variable l'associe a l'objet retourne 
par le constructeur. Cet objet n'a normalement qu'une reference : celle cachee derriere 
la variable liee. Appeler « untie » rompt l'association et elimine cette reference. Com- 
me il ne reste pas de reference a l'objet, la methode DESTROY est declenchee. 

Cependant, dans l'exemple ci-dessus nous avons stocke dans $x une deuxieme reference 
a l'objet lie. Cela veut dire qu'il reste une reference valide a l'objet apres le untie. DE- 
STROY n'est pas declenchee, et le fichier n'est ni enregistre, ni ferme. C'est pour cela que 
rien n'est sorti : le tampon du handle de fichier etait encore en memoire. II n'atteindra 
le disque qu'a la sortie du programme. 

Pour detecter ceci, vous pourriez utiliser l'option de ligne de commande -w ou inclure 
le pragma use warnings " untie" dans la portee lexicale courante. L'une ou l'autre tech- 
nique decelerait un appel a untie pendant qu'il reste des references a l'objet lie. Dans ce 
cas, Perl affiche cet avertissement : 

untie attempted while 1 inner references still exist 
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Pour faire marcher correctement le programme et faire taire Favertissement, eliminez 
les references supplementaires a l'objet lie avant d'appeler untie. Vous pouvez le faire 
explicitement : 

undef $x; 
untie $fred; 

Souvent vous pouvez resoudre le probleme en vous assurant simplement que vos varia- 
bles quittent leur portee au bon moment. 

Modules de liaison sur CPAN 

Avant de devenir tout inspire a l'idee d'ecrire votre propre module de liaison, vous de- 
vriez verifier que quelqu'un ne l'a pas deja fait. II y a beaucoup de modules de liaison 
sur CPAN, et il y en a des nouveaux tous les jours. (Enfin, chaque mois, en tout cas.) Le 
tableau 14-1 en liste quelques-unes. 

Tableau 14-1. Modules de liaison sur CPAN 



Module 


Description 


GnuPG: :Tie: :Encrypt 


Lie une interface de handle de fichier avec GNU Privacy Guard. 


10: 


WrapTie 


Emballe les objets lies avec une interface 10: : Handle. 


MLDBM 


Stocke de maniere transparente des donnees complexes, pas juste 
de simples chaines, dans un fichier DBM. 


Net 


:NISplusTied 


Lie des hachages a des tables NIS+. 


Tie 


:Cache::LRU 


Implemente un cache utilisant l'algorithme « Least Recently 
Used » (moins recemment utilise). 


Tie 


: Const 


Fournit des scalaires et des hachages constants. 


Tie 


: Counter 


Enchante une variable scalaire pour qu'elle s'incremente a cha- 
que fois qu'on y accede. 


Tie 


:CPHash 


Implemente un hachage insensible a la casse mais qui preserve la 
casse. 

Fournit un acces verrouille aux bases de donnees Berkeley DB 
1.x. 

Lie des hachages aux bases de donnees relationnelles DBI. 


Tie 


:DB_FileLock 


Tie 


:DBI 


Tie 


:DB_Lock 


Lie des hachages aux bases de donnees avec des verrouillages 
exclusifs et partages. 


Tie 


:Dict 


Lie un hachage a un serveur diet RPC. 


Tie 


:Dir 


Lie un hachage pour lire des repertoires. 


Tie 


:DirHandle 


Lie des handles de repertoire. 


Tie 


:FileLRUCache 


Implemente un cache LRU leger, base sur le systeme de fichiers. 


Tie 


:FlipFlop 


Implemente une liaison qui alterne entre deux valeurs. 


Tie 


:HashDefaults 


Permet a un hachage d'avoir des valeurs par defaut. 


Tie 


:HashHistory 


Garde l'historique de toutes les modifications d'un hachage. 


Tie 


:IxHash 


Fournit a Perl des tableaux associatifs ordonnes. 
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Module 


Description 


Tie: 


LDAP 


Implemente une interface a une base de donnees LDAE 


Tie: 


Persistent 


Fournit des structures de donnees persistantes via tie. 


Tie: 


Pick 


Choisit (et supprime) aleatoirement un element d'un ensemble. 


Tie: 


RDBM 


Lie des hachages aux bases de donnees relationnelles. 


Tie: 


SecureHash 


Permet l'encapsulation avec les espaces de noms. 


Tie: 


STDERR 


Envoie la sortie de votre STDERR a un autre processus tel qu'un 
systeme d'envoi de courrier. 


Tie: 


Syslog 


Lie un handle de fichier pour automatiquement enregistrer sa 
sortie avec syslog. 


Tie: 


TextDir 


I ip nn rpnprtniTP Hp firtiiprc 


Tie: 


TransactHash 


A^rt/iirin 1 i n n i n ^ <ro rtor tj~incoi , tiAnr cine ^nirnroi" 1 c\t*Hi*p nan 

ivioume un nacnage par transactions sans cnanger i orure pen- 
dant la transaction. 


Tie: 


VecArray 


Donne a un vecteur de bits une interface de tableau. 


Tie: 


Watch 


Place des temoins sur les variables Perl. 


Win32: :TieRegistry 


Fournit des manieres faciles et puissantes de manipuler la base de 






registres de Microsoft Windows. 



Ill 

Technique Perl 



15 

Unicode 



Si vous ne savez pas encore ce qu'est Unicode, vous le saurez bientot — meme si vous 
ne lisez pas ce chapitre — car travailler avec Unicode devient indispensable. (Certains 
pensent que c'est une necessite malefique mais c'est bien davantage une necessite bene- 
fique. Dans tous les cas, c'est un mal necessaire.) 

Historiquement, les gens ont construit des jeux de caracteres qui ref letaient ce qu'ils de- 
vaient faire dans le contexte de leur propre culture. Comme les gens de toutes les cultu- 
res sont naturellement paresseux, ils ont eu tendance a n'inclure que les symboles dont 
ils avaient besoin en excluant ceux qui ne leur etaient pas utiles. Cela fonctionnait a 
merveille aussi longtemps que nous ne communiquions qu'avec d'autres gens apparte- 
nant a notre propre culture, mais maintenant que nous commencons a utiliser l'lnter- 
net pour des communications interculturelles, nous nous heurtons a des problemes du 
fait de cette approche exclusive. II est deja difficile d'imaginer comment taper des carac- 
teres accentues sur un clavier americain. Comment dans le monde (litteralement) peut- 
on ecrire une page web multilingue ? 

Unicode est la solution, ou tout au moins une partie de la solution (voir egalement 
XML). Unicode est un jeu de caracteres inclusif plutot qu'exclusif. Alors que les gens 
peuvent chicaner, et ne s'en privent pas, sur les divers details d'Unicode (et il y a une 
grande quantite de details sur lesquels chicaner), l'intention generale est de contenter 
tout le monde de maniere suffisante 1 avec Unicode pour qu'ils utilisent de leur propre 
gre Unicode comme le medium international d'echange de donnees textuelles. Person- 
ne ne vous force a utiliser Unicode, tout comme personne ne vous force a lire ce chapitre 
(du moins, nous l'esperons). Les gens pourront toujours utiliser leurs anciens jeux de 
caracteres exclusifs dans leur propre culture. Mais dans ce cas (comme on dit), la porta- 
bilite en souffrira. 

La loi de la conservation de la souffrance dit que si nous reduisons la souffrance quelque 
part, elle doit augmenter autre part. Dans le cas d'Unicode, nous devons souffrir de la 
migration d'une semantique d'octet vers une semantique de caractere. Puisque, par un 



1. Ou dans certains cas, de mecontenter tout le monde de maniere insuffisante. 
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accident de l'histoire, il a ete invente par un Americain, Perl a historiquement confondu 
les notions d'octet et de caractere. En migrant vers Unicode, Perl ne doit plus les confon- 
dre d'une maniere ou d'une autre. 

Paradoxalement, en amenant Perl a ne plus confondre les octets et les caracteres, nous 
permettons aux programmeurs Perl de les confondre car ils savent que Perl retablira la 
distinction, exactement comme ils peuvent confondrent confondre les nombres et les 
chaines et s'en remettre a Perl pour convertir autant que necessaire les uns vers les 
autres et reciproquement. Autant que possible, Perl a une approche d'Unicode sembla- 
ble a son approche de tout le reste : Faire Ce Qu'il Faut Faire. Idealement, nous aime- 
rions parvenir a ces quatre objectifs : 

Objectifn" 1 

Les anciens programmes orientes octet ne devraient pas spontanement se planter 
avec les anciennes donnees orientees octet avec lesquelles ils travaillaient. 

Objectifn" 2 

Les anciens programmes orientes octet devraient par magie commencer a fonction- 
ner avec les nouvelles donnees orientees caractere lorsque c'est approprie. 

Objectifn" 3 

Les programmes devraient tourner aussi vite avec les nouvelles donnees orientees 
caractere qu'avec les anciennes donnees orientees octet. 

Objectifn" 4 

Perl devrait rester un langage unifie plutot que se scinder en un Perl oriente octet 
et un Perl oriente caractere. 

Pris ensemble, ces objectifs sont pratiquement impossibles a atteindre. Mais nous nous 
en approchons relativement bien. Ou plutot, nous sommes toujours dans le processus 
de rapprochement, puisqu'il s'agit d'une tache en cours de realisation. Perl continue 
d'evoluer en meme temps qu'Unicode. Mais notre plan d'envergure est d'offrir une voie 
de migration qui soit sure et qui puisse nous amener la ou nous voulons aller en ren- 
contrant le minimum d'accidents en cours de route. Comment y arriver est le sujet du 
prochain paragraphe. 

Construction d'un caractere 

Dans les versions de Perl anterieures a 5.6, toutes les chaines etaient vues en tant que 
sequences d'octets. Dans les versions 5.6 et suivantes, une chaine peut toutefois contenir 
des caracteres d'une taille superieure a un octet. Nous voyons maintenant les chaines, 
non plus en tant que sequences d'octets, mais en tant que sequences de numeros com- 
pris dans l'intervalle 0 .. 2**32-1 (ou dans le cas d'ordinateurs 64 bits, 0 .. 2**64-1). 
Ces numeros representent des caracteres abstraits et, dans un certain sens, plus grand est 
le numero, plus la taille du caractere est grande ; mais au contraire de beaucoup de lan- 
gages, Perl n'est pas lie a une taille particuliere de la representation d'un caractere. Perl 
utilise un encodage de taille variable (base sur UTF8), ainsi ces numeros de caracteres 
abstraits peuvent etre empaquetes, ou non, a raison d'un numero par octet. Evidem- 
ment, le numero de caractere 18 446 744 073 709 551 515 (c'est-a-dire, 
« \x{ffff_ffff_ffff_ffff } ») ne tiendra jamais dans un octet (en fait, il prend 13 oc- 
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tets) mais si tous les caracteres de votre chaine se situent dans Fintervalle 0. .127 en de- 
cimal, alors ils seront certainement empaquetes a raison d'un par octet, puisque l'UTF8 
est identique a l'ASCII pour les sept premiers bits de poids faible. 

Perl utilise de l'UTF8 lorsqu'il pense que c'est benefique, ainsi, si tous les caracteres de 
votre chaine sont dans Fintervalle 0. .255, il y a une grande chance que les caracteres 
soient empaquetes dans des octets — mais en l'absence d'autre informations connues, 
vous ne pouvez etre sur car Perl fait en interne une conversion entre les caracteres 8 bits 
et les caracteres UTF8 de taille variable si necessaire. L'essentiel est que vous ne devriez 
pas vous en soucier la plupart du temps car la semantique de caractere est preservee a 
un niveau abstrait independamment de la representation. 

Dans tous les cas, si votre chaine contient des numeros de caracteres superieurs a 255 en 
decimal, la chaine est certainement stockee en UTF8. Plus exactement, elle est stockee 
dans la version etendue d'UTF8 de Perl que nous appelons utf8, en hommage au prag- 
ma du mime nom, mais surtout parce que c'est plus simple a taper. (Et de plus, l'UTF8 
« reel » n'est autorise a contenir que des numeros de caracteres consacres par le Consor- 
tium Unicode. Vutf8 de Perl est autorise a contenir tous les caracteres dont vous avez 
besoin pour accomplir votre travail. Perl se moque du fait que vos numeros de caracte- 
res soient officiellement corrects ou juste corrects.) 

Nous avons dit que vous ne devriez pas vous en soucier la plupart du temps, mais les 
gens aiment de toute facon se faire du souci. Supposez que vous ayez une v-chame re- 
presentant une adresse IPv4 : 

$adr_loc = vl27. 0.0.1; # Surement stockee en octets. 

$oreilly = V204.148.40.9; # Pourrait etre stockee en octets ou en utf8. 

$adr_nok = V2004.148.40.9; # Surement stockee en utf8. 

Tout le monde peut s'apercevoir que $adr_nok ne marchera pas en tant qu'adresse IP II 
est done facile de penser que si l'adresse reseau d'O'Reilly est forcee a une representation 
UTF8, elle ne marchera plus. Mais les caracteres dans la chaine sont des numeros abs- 
traits, non des octets. Tout ce qui utilise une adresse IPv4, comme la fonction 
gethostbyaddr, devrait automatiquement forcer les numeros de caracteres abstrait a 
etre reconvertis vers une representation en octets (et echouer avec $adr_nok). 

Les interfaces entre Perl et le monde reel doivent s'accommoder des details de la repre- 
sentation. Jusqu'a un certain point, les interfaces existantes essaient de faire ce qu'il faut 
sans que vous ayez a leur dire quoi faire. Mais de temps en temps, vous devez donner 
des instructions a certaines interfaces (comme la fonction open) et si vous ecrivez votre 
propre interface vers le monde reel, elle aura besoin d'etre soit assez astucieuse pour ar- 
river a comprendre les choses par elle-meme, soit au moins assez elegante pour suivre 
les instructions lorsque que vous voulez qu'elle se comporte differemment de ce qu'elle 
aurait fait par defaut. 2 



2. Sur certains systemes, il peut y avoir des moyens de basculer toutes vos interfaces en une 
seule fois. Si l'option de la ligne de commande -C est utilisee (ou la variable globale 
${ A WIDE_SYSTEM_CALLS} est positionnee a 1), tous les appels systeme utiliseront les API de 
« caracteres larges » (wide character). (Ceci n'est actuellement implements que sur Microsoft 
Windows.) Le projet actuel de la communaute Linux est que toutes les interfaces basculeront en 
mode UTF8 si $ENV{LC_TYPE} est positionnee a « UTF8 ». Les autres communautes peuvent adop- 
ter d'autres approches. Ce n'est pas une regie absolue. 
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Puisque Perl se soucie de maintenir une semantique de caractere transparente a Finte- 
rieur du langage lui-meme, la seule place oil vous devez vous inquieter d'une semanti- 
que d'octet, opposee a une semantique de caractere, est dans vos interfaces. Par defaut, 
toutes vos anciennes interfaces Perl vers le monde exterieur sont orientees octet. C'est- 
a-dire qu'a un niveau abstrait, toutes vos chaines sont des sequences de numeros dans 
l'intervalle 0. . 255, ainsi, si rien dans le programme ne les force a des representations en 
utf8, vos anciens programmes continueront a fonctionner avec des donnees orientees 
octet comme ils le faisaient auparavant. Vous pouvez done cocher Fobjectif n°l ci-des- 
sus. 

Si vous voulez que vos anciens programmes fonctionnent avec les nouvelles donnees 
orientees caractere, vous devez marquer vos interfaces orientees caractere de maniere 
que Perl s'attende a recevoir des donnees orientees caractere de ces interfaces. Une fois 
que e'est fait, Perl devrait automatiquement faire toutes les conversions necessaires pour 
preserver l'abstraction des caracteres. La seule difference est que vous devez introduire 
dans votre programme des chaines qui soient marquees comme contenant potentielle- 
ment des caracteres plus grands que 255, ainsi, si vous effectuez une operation entre une 
chaine d'octets et une chaine utf8, Perl convertira en interne la chaine d'octets en une 
chaine utf8 avant d'effectuer Foperation. Generalement, les chaines utf8 ne sont recon- 
verties en chaines d'octets que lorsque vous les envoyez a une interface orientee octet, 
auquel cas, si vous aviez une chaine contenant des caracteres plus grands que 255, vous 
aurez un probleme qui peut etre resolu de diverses manieres selon Finterface en ques- 
tion. Vous pouvez done cocher Fobjectif n°2. 

Parfois, vous voulez melanger du code comprenant une semantique de caractere avec 
du code devant tourner avec une semantique d'octet, comme du code d'entrees/sorties 
qui lit ou ecrit des blocs de taille fixe. Dans ce cas, vous pouvez mettre une declaration 
use bytes autour du code oriente octet pour le forcer a utiliser une semantique d'octet 
meme sur les chaines marquees en tant que chaines utf8. Les conversions sont alors sous 
votre responsabilite. Mais e'est un moyen de renforcer une lecture locale plus stricte de 
Fobjectif n°l, au depend d'une lecture globale plus relachee de Fobjectif n°2. 

L'objectif n°3 a largement ete atteint, en partie en faisant des conversions paresseuses 
entre les representations en octets et en utf8 et en partie en etant discret sur la maniere 
dont nous avons implements potentiellement des fonctionnalites lentes d'Unicode, 
comme la recherche des proprietes de caracteres dans des tables enormes. 

L'objectif n°4 a ete atteint en sacrifiant un peu de la compatibility des interfaces a la que- 
te des autres objectifs. D'une certaine facon, nous n'avons pas bifurque vers deux Perl 
differents ; mais en le considerant d'une autre maniere, la revision 5.6 de Perl est une 
version bifurquee de Perl au regard des versions anterieures et nous ne nous attendons 
pas a ce que les gens migrent depuis leurs versions anterieures avant d'etre surs que la 
nouvelle version fera bien ce qu'ils veulent. Mais e'est toujours le cas avec les nouvelles 
versions, nous nous permettrons done de cocher egalement l'objectif n°4. 

Consequences de la semantique de caractere 

Le resultat de tout ceci est qu'un operateur interne typique manipulera des caracteres 
sauf s'il est dans la portee d'un pragma use bytes. Toutefois, meme en dehors de la por- 
tee d'un use bytes, si tous les operandes de Foperateur sont stockes en tant que carac- 
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teres 8 bits (c'est-a-dire qu'aucune operande n'est stockee en tant qu'utfiS), alors la 
semantique de caractere se confond avec la semantique d'octet et le resultat de l'opera- 
teur sera stocke en interne dans un format 8 bits. Ceci preserve une compatibility ante- 
rieure pourvu que vous n'approvisionniez pas vos programmes avec des caracteres plus 
larges qu'en Latin-1. 

Le pragma utf 8 est avant tout un dispositif de compatibilite permettant la reconnais- 
sance de TUTF8 dans les litteraux et les identificateurs rencontres par l'analyseur gram- 
matical. II peut egalement etre utilise pour permettre certaines fonctionnalites des plus 
experimentales d'Unicode. Notre objectif a longterme est de changer le pragma utf8 en 
une operation ne faisant rien (no-op). 

Le pragma use bytes ne sera jamais change en une operation ne faisant rien. Non seu- 
lement il est necessaire pour le code oriente octet, mais un de ses effets de bords est ega- 
lement de definir des enrobages orientes octet autour de certaines fonctions pour les 
utiliser en dehors d'une portee de use bytes. Au moment oil nous ecrivons ceci, le seul 
enrobage defini est pour la fonction length mais d'autres sont susceptibles de l'etre au 
fil du temps. Pour utiliser cet enrobage, ecrivez : 

use bytes (); # Charge les enrobages sans importer la semantique d'octet. 

$lg_car = length("\x{ffff_ffff}"); # Renvoie 1. 

$lg_oct = bytes: :length("\x{ffff_ffff}"); # Renvoie 7. 

En dehors de la portee d'une declaration use bytes, la version 5.6 de Perl fonctionne 
(ou du moins, est censee fonctionner) ainsi : 

• Les chaines et les motifs peuvent maintenant contenir des caracteres ayant une 
valeur ordinale superieure a 255 : 

use utf8; 
$convergence = 

En supposant que vous ayez un editeur compatible avec Unicode pour editer votre 
programme, de tels caracteres se presenteront generalement directement a l'inte- 
rieur de chaines litterales en tant que caracteres UTF8. Pour le moment, vous devez 
declarer un use utf 8 au debut de votre programme pour permettre Futilisation de 
FUTF8 dans les litteraux. 

Si vous ne disposez pas d'editeur Unicode, vous pouvez toujours specifier un carac- 
tere particulier en ASCII avec une extension de la notation \x. Un caractere dans 
Fintervalle Latin-1 peut etre ecrit comme \x{ab} ou comme \xab mais si le numero 
depasse les deux chiffres hexadecimaux, vous devez utiliser des accolades. Les carac- 
teres Unicode sont specifies en mettant le code hexadecimal a l'interieur des accola- 
des apres le \x. Par exemple, un smiley Unicode vaut \x{263A}. II n'y a pas de 
construction syntaxique en Perl presumant que les caracteres Unicode fassent exac- 
tement 16 bits, vous ne pouvez done pas utiliser \u263A comme dans certains langa- 
ges ; \x{263A} est l'equivalent le plus proche. 

Pour inserer des caracteres nommes via \U{NOM_CAR}, voir le pragma use charna- 
mes au chapitre 31, Modules de pragmas. 

' Les identificateurs a l'interieur du script Perl peuvent contenir des caracteres Uni- 
code alphanumeriques, y compris des ideogrammes : 

use utf8; 
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$A++J # Un enfant est ne. 
Ici encore, use utf 8 est necessaire (pour l'instant) pour reconnaitre de TUTF8 dans 
votre script. Vous etes actuellement livre a vous-meme lorsqu'il s'agit d'utiliser les 
formes canoniques des caracteres — Perl ne tente pas (encore) de canoniser pour 
vous les noms de variable. Voir ivww.unicode.org pour le dernier rapport sur la cano- 
nisation. 

• Les expressions regulieres correspondent a des caracteres au lieu d'octets. Par exem- 
ple un point correspond a un caractere au lieu de correspondre a un octet. Si le 
Consortium Unicode arrive meme a approuver l'emploi du twengar, alors (malgre 
le fait que de tels caracteres sont represented avec 4 octets en UTF8), ceci reussi la 
correspondance : 

"\N{TENGWAR LETTER SILME NUOUERNA}" =~ / A .$/ 
Le motif \C est fourni pour forcer une correspondance a un seul octet (« char » en 
C, d'ou \C). Utilisez \C avec prudence, puisqu'il peut desynchroniser des caracteres 
dans votre chaine et vous pouvez obtenir des erreurs « Caractere UTF8 mal 
forme ». Vous ne pouvez pas utiliser \C dans des crochets, puisqu'il ne represente 
aucun caractere particulier, ni aucun ensemble de caracteres. 

• Les classes de caracteres dans les expressions regulieres correspondent a des caracte- 
res au lieu d'octets et correspondent avec les proprietes des caracteres specifiers 
dans la base de donnees des proprietes Unicode. Ainsi, \w peut etre utilise pour cor- 
respondre a un ideogramme : 

"A" =~ Aw/ 

• Les proprietes nominees d'Unicode et les intervalles de blocs peuvent etre utilises 
comme classes de caracteres avec les nouvelles constructions \p (correspond a la 
propriete) et \P (ne correspond pas a la propriete). Par exemple, \p{Lu} correspond 
a tout caractere ayant la propriete majuscule d'Unicode, alors que \p{M} corres- 
pond a tout caractere marque. Les proprietes d'une seule lettre peuvent omettre les 
accolades, ainsi \pM peut egalement correspondre a des caracteres marques. Beau- 
coup de classes de caracteres predefinies sont disponibles, comme \p{IsMirrored} 
et \p{InTibetan} : 

"\N{greek:Iota}" =~ /p{Lu}/ 
Vous pouvez egalement utiliser \p et \P a l'interieur des crochets des classes de 
caracteres. (Dans la version 5.6.0 de Perl, vous avez besoin de faire use utf 8 pour 
que les proprietes des caracteres fonctionnent bien. Cette restriction sera levee a 
Favenir.) Voir le chapitre 5, Correspondance de motifs, pour plus de details sur la cor- 
respondance de proprietes Unicode. 

• Le motif special \X correspond a toute sequence Unicode etendue (une « sequence 
de caracteres combines » en langage standard), oil le premier caractere est un carac- 
tere de base et les suivants des caracteres marques s'appliquant au caractere de base. 
C'est equivalent a ( ? : \PM\pM*) : 

"o\N{C0MBINING TILDE BELOW}" =~ AX/ 
Vous ne pouvez pas utiliser \X a l'interieur de crochets car il pourrait correspondre 
a plusieurs caracteres et il ne represente aucun caractere particulier, ni aucun 
ensemble de caracteres. 
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• L'operateur tr/// traduit des caracteres au lieu d'octets. Pour changer tous les carac- 
teres hors de Fintervalle Latin-1 en points d'interrogation, vous pourriez ecrire : 

tr/\0-\x{lOffff}/\0-\xff?/; # caractere utf8 vers latinl 

• Les operateur de traduction de casse utilise des tables de traduction de casse Uni- 
code lorsqu'on leur fournit des caracteres en entree. Remarquer que uc traduit en 
majuscules, alors qu'ucf isrt traduit Finitiale en majuscule de titre (titlecase), pour 
les langages qui font la distinction. Naturellement les sequences d'antislashs corres- 
pondantes ont la meme semantique : 



$x = 


"\u$mot"; 


# met l'initiale de $mot en 


majuscule de titre 


$x = 


"\U$mot"; 


# met $mot en majuscules 




$x = 


"\l$mot"; 


# met l'initiale de $mot en 


minuscule 


$x = 


"\L$mot"; 


# met $mot en minuscules 





Soyez prudent, car les tables de traduction de casse Unicode ne tentent pas de four- 
nir des tables de correspondance bijectives pour chaque instance, particulierement 
pour les langages utilisant un nombre de caracteres different pour les majuscules et 
les minuscules. Comme ils disent dans les standards, alors que les proprietes de 
casse sont elles-memes normatives, les tables de casse ne sont qu'informelles. 

• La plupart des operateurs manipulant des positions ou des longueurs dans une 
chaine basculeront automatiquement a l'utilisation de positions de caracteres, ce 
qui comprend : chop, substr, pos, index, rindex, sprintf, write et length. Les ope- 
rateurs qui ne basculent pas deliberement comprennent vec, pack et unpack. Les 
operateurs qui s'en moquent vraiment comprennent chomp, ainsi que tout autre 
operateur traitant une chaine comme un paquet de bits, tels que le sort par defaut 
et les operateurs manipulant des fichiers. 

use bytes; 

$lg_octets = length("De fais de l'^MM"); # 15 octets 
no bytes; 

$lg_caracs = length("De fais de l'-^UJI"); # mais 9 caracteres 

• Les lettres « c » et « C » de pack/unpack ne changent pas, puisqu'elles sont souvent 
utilisees pour des formats orientes octet. (Encore une fois, pensez « char » en lan- 
gage C.) Toutefois, il existe un nouveau specificateur « U », qui fera les conversions 
entre les caracteres UTF8 et les entiers : 

pack("U*", 1, 20, 300, 4000) eq vl. 20. 300. 4000 

• Les fonctions chr et ord fonctionnent avec des caracteres : 

chr(l).chr(20).chr(300).chr(4000) eq vl. 20. 300. 4000 
En d'autres termes, chr et ord sont comme pack("U") et unpack("U") et non 
comme pack("C") et unpack("C"). En fait, ces derniers sont un moyen pour vous 
d'emuler les fonctions chr et ord orientees octet si vous etes trop paresseux pour 
faire un use bytes. 

• Enfin, un reverse en contexte scalaire inverse par caractere plutot que par octet : 

"tw =»" gq reverse " <®°" 

Si vous regardez dans le repertoire CHEMIN_BIBLI0THE0UE_PERL/unicode, vous trouve- 
rez de nombreux fichiers en rapport avec la definition des semantiques ci-dessus. La 
base de donnees des proprietes Unicode provenant du Consortium Unicode se situe 
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dans un fichier appele Unicode.300 (pour Unicode 3.0). Ce fichier a deja ete traite par 
mktables.PL pour donner un tas de petits fichiers .pi dans le meme repertoire (et dans 
les sous-repertoires Is/, In/ et To/), dont certains sont automatiquement avales par Perl 
pour implementer des choses comme \p (voir les repertoires Is/ et In/) et uc (voir le re- 
pertoire To/). Les autres fichiers sont avales par des modules comme le pragma use 
charnames (voir Name.pl). Mais au moment oil nous ecrivons ceci, il reste encore de 
nombreux fichiers qui sont juste assis la sans rien faire, en attendant que vous leur ecri- 
viez un module d'acces : 

ArabLink.pl 

ArabLnkGrp.pl 

Bidirectional.pl 

Block.pl 

Category.pl 

CombiningClass.pl 

Decomposition.pl 

JamoShort.pl 

Number.pl 

To/Digitpl 

Un resume bien plus lisible d'Unicode, avec beaucoup de liens hypertextes, se trouve 
dans CHEMIN_ BIBL I0THE0UE_ PERL/unicode/Unicode3. html. 

Remarquez que lorsque le Consortium Unicode sort une nouvelle version, certains de 
ces noms de fichier sont susceptibles de changer, vous devrez done fouiller un peu. Vous 
pouvez trouver CHEMIN_BIBLIOTHEOUE_PERL avec Fincantation suivante : 

% perl -MConfig -le 'print $Config{privlib}' 

Pour trouver tout ce que Ton peut trouver sur Unicode, vous devriez consulter The Uni- 
code Standard Version 3.0 (ISBN 0-201-61633-5). 

Attention A au travail 

Au moment ou nous ecrivons ceci (e'est-a-dire, en phase avec la version 5.6.0 de Perl), il 
existe encore des precautions a prendre pour utiliser Unicode. (Consultez votre docu- 
mentation en ligne pour les mises a jour.) 

• Le compilateur d'expressions regulieres existant ne produit pas de codes d'opera- 
tions (opcodes) polymorphiques. Cela signifie que le fait de determiner si un motif 
particulier correspondra ou non a des caracteres Unicode est realise lorsque le 
motif est compile (base sur le fait que le motif contient ou non des caracteres Uni- 
code) et non lorsque la correspondance arrive a l'execution. Ceci doit etre change 
pour correspondre de maniere adaptee a de l'Unicode si la chaine sur laquelle se 
fait la correspondance est en Unicode. 

• Il n'y a actuellement pas de moyen facile de marquer une donnee lue depuis un 
fichier ou depuis tout autre source externe comme etant en utf8. Ceci sera un 
domaine sur lequel se concentrer dans un futur proche et ce sera probablement 
deja corrige au moment ou vous lirez ceci. 
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II n'y a pas de methode pour forcer automatiquement l'entree et la sortie vers 
d'autres encodages que UTF8. Ceci est toutefois prevu dans un futur proche, con- 
sultez done votre documentation en ligne. 

• L'utilisation de locales avec utf8 peut conduire a d'etranges resultats. Actuellement, 
il existe quelques tentatives pour appliquer 1' information d'une locale 8 bits a des 
caracteres dans l'intervalle 0 . . 255 mais ceci est de facon evidente incorrect pour des 
locales qui utilisent des caracteres au-dela de cet intervalle (lorsqu'ils sont convertis 
en Unicode). Cela aura egalement tendance a tourner plus lentement. Le bannisse- 
ment des locales est fortement encourage. 

L'Unicode est « fun » — il faut juste que vous definissiez le fun correctement. 



16 

Communication 
interprocessus 



Les processus peuvent communiquer de presque autant de facons que les personnes. 
Mais les difficultes de la communication interprocessus ne devraient pas etre sous-esti- 
mees. II ne vous sert a rien d'attendre une replique verbale si votre partenaire n'utilise 
que le langage des signes. De meme, deux processus ne peuvent se parler que lorsqu'ils 
s'accordent sur la methode de communication et sur les conventions baties sur cette me- 
thode. Comme avec tout type de communication, l'eventail des conventions sur lesquel- 
les s'accorder va du lexical au pragmatique : tout, depuis quel jargon vous utiliserez 
jusqu'au choix de celui dont c'est le tour de parler. Ces conventions sont necessaires car 
il est tres difficile de communiquer avec une semantique pure, depouillee de tout con- 
texte. 

Dans notre jargon, la communication interprocessus s'epelle habituellement IPC (Inter- 
Process Communication). Les fonctionnalites d'IPC de Perl vont du tres simple au tres 
complexe. Votre choix depend de la complexite des informations a communiquer. La 
forme la plus simple d'information est, d'une certaine maniere, aucune information, si- 
non l'avertissement qu'un certain evenement s'est produit a un certain moment. En 
Perl, ces evenements sont communiques par un mecanisme de signal inspire de celui du 
systeme UNIX. 

A l'autre extreme, les fonctionnalites de socket de Perl permettent de communiquer 
avec n'importe quel autre processus de l'lnternet grace a n'importe quel protocole mu- 
tuellement supporte. Cette liberte a bien stir un prix : vous devez parcourir un certain 
nombre d'etapes pour mettre en place la connexion et vous assurer que vous parlez le 
meme langage que le processus a l'autre bout. Ce qui peut vous forcer a adherer a 
d'etranges coutumes, selon les conventions culturelles en usage. II se peut meme que 
pour etre correct au niveau du protocole, vous deviez meme vous mettre a parler un 
langage comme XML, Java ou Perl. Quelle horreur ! 

Entre ces deux extremes, on trouve des fonctionnalites intermediaries concues a l'origi- 
ne pour faire communiquer des processus sur la meme machine. II s'agit notamment 
des bons vieux fichiers, des pipes (ou tubes), des FIFO et les divers appels systeme d'IPC 
System V L'implementation de ces fonctionnalites varie selon les plates-formes ; les sys- 
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temes Unix modernes (y compris le MAC OS X d'Apple) devraient toutes les implemen- 
ter et, mis a part les signaux et les IPC System V la plupart des autres sont implementees 
sur les systeme d'exploitation recents de Microsoft, y compris les pipes, les forks, les ver- 
rouillages de fichiers et les sockets. 1 

Vous pouvez trouver de plus amples informations sur le portage en general dans l'en- 
semble de documentations standard de Perl (dans n'importe quel format affiche par vo- 
tre systeme) sous perlport. Les informations specifiques a Microsoft peuvent etre 
trouvees sous perlu>in32 etperlfork, qui sont installed meme sur des systemes non-Micro- 
soft. Pour les livres publies, nous vous suggerons les suivants : 

• Perl en action, par Tom Christiansen et Nathan Torkington (O'Reilly Associates, 
1998), chapitres 16 a 18. 

• Advanced Programming in the UNIX Environment, par W. Richard Stevens (Addison- 
Wesley, 1992). 

• TCP/IP Illustrated, par W. Richard Stevens, Volumes I-III (Addison-Wesley, 1992- 
1996). 

Signaux 

Perl utilise un modele simple de gestion des signaux : le hachage %SIG contient des re- 
ferences (qu'elles soient symboliques ou en dur) a des gestionnaires de signaux definis 
par Futilisateur. Certains evenements entrainent le systeme d'exploitation a delivrer un 
signal au processus affecte. Le gestionnaire correspondant a cet evenement est appele 
avec un argument contenant le nom du signal qui Fa declenche. Pour envoyer un signal 
a un autre processus, utilisez la fonction kill. Pensez-y comme a une information d'un 
bit envoyee a l'autre processus. 2 Si ce processus a installe un gestionnaire de signal pour 
le signal en question, il peut executer du code lorsqu'il le recoit. Mais il n'y a aucun 
moyen pour le processus emetteur d'obtenir une quelconque sorte de valeur de retour, 
autre que de savoir si le signal a ete legitimement envoye. L'emetteur ne recoit aucun 
retour lui disant ce que le processus recepteur a fait du signal, s'il en a fait quelque chose. 

Nous avons classe cette fonctionnalite dans les IPC alors qu'en fait, les signaux peuvent 
provenir de diverses sources et pas seulement d'autres processus. Le signal pourrait ega- 
lement provenir du meme processus, ou bien il pourrait etre genere lorsque l'utilisateur 
tape au clavier une sequence particuliere comme Ctrl-C ou Ctrl-Z, ou il pourrait etre 
fabrique par le noyau quand certains evenements se produisent, comme la fin d'un pro- 
cessus fils, ou lorsque le processus n'a plus assez d'espace sur la pile, ou parce qu'un fi- 
chier a atteint sa taille limite en memoire. Mais votre propre processus ne sait pas 
distinguer facilement ces differents cas. Un signal ressemble a un paquet qui arrive mys- 
terieusement sur le pas de la porte sans l'adresse de l'expediteur. Vous feriez mieux 
d'etre prudent au moment de l'ouvrir. 

Puisque les entrees dans le hachage %SIC peuvent etre des references en dur, une tech- 



1. Enfin, sauf les sockets AFJJNIX. 

2. En fait, il s'agit plus de cinq ou six bits, selon le nombre de signaux definis par votre systeme 
d'exploitation et si l'autre processus utilise le fait que vous n'avez pas envoye un signal different. 
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nique courante est d'utiliser des fonctions anonymes pour les gestionnaires de signaux 
simples : 

$SIG{INT} = sub { die "\nlci\n" }; 

$SIG{ALRM} = sub { die "Votre minuterie a expire" }; 

Ou vous pourriez creer une fonction nommee et affecter son nom ou une reference a 
l'entree appropriee du hachage. Par exemple, pour intercepter les signaux d'interrup- 
tion et de sortie (souvent associes aux touches Ctrl-C et Ctrl-\ sur votre clavier), mettez 
en place un gestionnaire comme ceci : 

sub intercepte { 

my $nom_sig = shift; 
our $ben_voyons++; 

die "Ouelqu'un m J a envoye un SIC$nom_sig !"; 

} 

$ben_voyons = 0; 

$SIG{INT} = 'intercepte''; # signifie toujours &main: : intercepte 
$SIG{INT} = \&intercepte; # la meilleure strategie 
$SIG{QUIT} = \Sintercepte; # en intercepte egalement un autre 

Remarquez que tout ce que nous faisons dans le gestionnaire de signaux est de position- 
ner une variable globale et de lever une exception avec die. Evitez autant que possible 
de faire quelque chose de plus complique que cela car sur la plupart des systemes, la bi- 
bliotheque C n'est pas reentrante. Les signaux sont delivres de maniere asynchrone, 3 
ainsi, l'appel a une quelconque fonction print (voire a tout ce qui a besoin d'allouer 
plus de memoire avec malloc(3)) pourrait en theorie declencher une erreur de memoire 
et engendrer un core dump si vous etiez deja dans une routine apparentee de la biblio- 
theque C lorsque le signal a ete delivre. (Meme la routine die est quelque peu dange- 
reuse sauf si le processus est execute a Finterieur d'un eval, ce qui supprime les entrees/ 
sorties depuis die et par consequent empeche d'appeler la bibliotheque C. Probable- 
ment.) 

Une maniere encore plus simple d'intercepter les signaux est d'utiliser le pragma sig- 
trap pour installer de simples gestionnaires de signaux par defaut : 

use sigtrap qw(die INT QUIT); 
use sigtrap qw(die untrapped normal-signals 
stack-trace any error-signals); 

Le pragma est tres utile lorsque vous ne voulez pas vous embeter a ecrire votre propre 
gestionnaire mais que vous voulez toujours intercepter les signaux dangereux et tout 
fermer dans les regies. Par defaut, certains de ces signaux ont un caractere si fatal pour 
votre processus que votre programme s'arretera en pleine course lorsqu'il en recevra un. 
Malheureusement, cela signifie que les fonctions END gerant la terminaison du program- 
me et les methodes DESTROY s'occupant de l'achevement d'un objet ne seront pas appe- 
lees. Mais elks le seront sur des exceptions Perl ordinaires (comme lorsque vous appelez 
die), vous pouvez done utiliser ce pragma pour convertir sans douleur les signaux en 



3. La synchronisation de remission de signaux avec les codes d'operations (opcodes) au niveau 
de Perl est planifiee pour une prochaine version de Perl, ce qui devrait regler les questions de 
signaux et de core dumps. 
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exceptions. Meme si vous ne manipulez pas de signaux vous-meme, votre programme 
devra bien se comporter quand meme. Voir la description de use sigtrap au Chapitre 
31, Modules de pragmas, pour beaucoup plus de fonctionnalites de ce pragma. 

Vous pouvez egalement choisir d'affecter au gestionnaire de %SIC les chaines « IGNORE » 
ou « DEFAULT », auquel cas Perl essayera d'ecarter le signal ou permettra que se produise 
Faction par defaut pour ce signal (bien que certains signaux ne peuvent etre ni intercep- 
tes ni ignores, comme les signaux KILL et STOP ; voir signal(3), s'il est implemente, pour 
obtenir une liste des signaux disponibles sur votre systeme et leur comportement par 
defaut). 

Le systeme d'exploitation voit les signaux comme des nombres plutot que comme des 
noms, mais Perl, comme la plupart des gens, prefere les noms symboliques aux nom- 
bres magiques. Pour trouver les noms des signaux, passez en revue les cles du hachage 
%SIG ou utilisez la commande kill -I si vous en disposez sur votre systeme. Vous pouvez 
egalement utiliser le module standard Conf ig pour determiner la correspondance que 
fait votre systeme entre les noms et les numeros des signaux. Voir Config(3) pour des 
exemples. 

Puisque %SIG est un hachage global, les affections que vous y effectuez se repercutent 
sur tout votre programme. II est souvent plus respectueux pour le reste de votre pro- 
gramme de confiner Finterception des signaux a une portee reduite. Faites cela avec une 
affectation en local du gestionnaire de signaux, ce qui n'a plus d'effet une fois que Fon 
sort du bloc Fencadrant. (Mais souvenez-vous que les valeurs avec local sont visibles de- 
puis les fonctions appelees depuis ce bloc.) 

{ 

local $SIG{INT} = 'IGNORE'; 

# Faites ce que vous voulez ici, en ignorant tous les SIGINT. 
fn(); # Les SIGINT sont egalement ignores dans fn() ! 

# Et ici. 

} # La fin du bloc restaure la valeur precedente de $SIG{INT}. 

fn(); # Les SIGINT ne sont pas ignores dans fn() (a priori). 

Envoi de signaux a des groupes de processus 

Les processus (du moins sous Unix) sont organises en groupes de processus, correspon- 
dant generalement a une tache complete. Par exemple, lorsque vous lancez une seule 
commande shell consistant en une serie de filtres envoyant les donnees de Fun a Fautre 
a travers des pipes, ces processus (et leurs fils) appartiennent au meme groupe. Ce grou- 
pe de processus possede un numero correspondant au numero du processus leader de 
ce groupe. Si vous envoyez un signal a un numero de processus positif, il n'est transmis 
qu'a ce processus ; mais si vous Fenvoyez a un numero negatif, le signal est transmis a 
tous les processus dont le numero de groupe est le nombre positif correspondant, c'est- 
a-dire le numero de processus du leader de ce groupe. (De facon bien pratique, pour le 
leader du groupe, FID du groupe de processus est simplement $$.) 

Imaginez que votre programme veuille envoyer un signal « hang-up » a tous ses proces- 
sus fils, ainsi qu'a tous les petits-fils lances par ces fils, ainsi qu'a tous les arrieres-petits- 
fils lances par ces petits-fils, ainsi qu'a tous les arrieres-arrieres-petits-fils lances par ces 
arrieres-petits-fils, et ainsi de suite. Pour faire cela, votre programme appelle d'abord 
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setpgrp(o,o) pour devenir le leader d'un nouveau groupe de processus et tous les pro- 
cessus qu'il creera ensuite feront partie de ce nouveau groupe. II importe peu que ces 
processus soient demarres manuellement via fork ou automatiquement via des open 
sur des pipes ou encore en tant que taches d'arriere-plan avec system("cmd &"). Meme 
si ces processus ont leurs propres fils, l'envoi d'un signal « hang-up » au groupe de pro- 
cessus entier les trouvera tous (sauf pour les processus qui ont positionne leur propre 
groupe de processus ou change leur UID pour s'auto-accorder une immunite diploma- 
tique envers vos signaux). 

{ 

local $SIG{HUP} = 'IGNORE'; # m'exempte 
kill(HUP, -$$); # envoie le signal a mon propre 

# groupe de processus 

} 

Un autre signal interessant est le signal numero 0. En fait, ce dernier n'affecte pas le pro- 
cessus cible mais verifie plutot s'il est toujours en vie et s'il n'a pas change son UID. C'est- 
a-dire qu'il verifie s'il est legal de lui envoyer un signal sans le faire effectivement. 

unless (kill 0 => $pid_fils) { 

warn "quelque chose d'affreux est arrive a $pid_fils"; 

} 

Le signal numero 0 est le seul qui fonctionne de la meme facon sous les portages sur 
Microsoft comme il le fait sous Unix. Sur les systemes Microsoft, kill ne delivre pas ef- 
fectivement de signal. A la place, il force le processus fils a se terminer avec le statut in- 
dique par le numero de signal. II se peut que cela soit corrige un jour. Cependant, le 
signal magique 0 a toujours le comportement par defaut, non-destructeur. 

Fossoyage des zombies 

Lorsqu'un processus se termine, son pere recoit un signal CHLD envoye par le noyau et 
le processus devient un zombie 4 jusqu'a ce que le parent appelle wait ou waitpid. Si 
vous demarrez un autre processus en Perl en utilisant n'importe quoi d'autre que fork, 
Perl s'occupe de fossoyer vos fils zombies mais si vous utilisez un fork pur, vous etes cen- 
ses nettoyer derriere vous. Sur la plupart des noyaux, mais pas tous, une bidouille sim- 
ple pour fossoyer automatiquement les zombies consiste a positionner $SIG{CHLD} a 
'IGNORE'. Une approche plus souple (mais fastidieuse) est de les fossoyer vous-memes. 
Comme il se peut qu'il y ait plus d'un fils qui soit mort avant que vous ne vous en oc- 
cupiez, vous devez rassembler vos zombies dans une boucle jusqu'a ce qu'il n'y en ait 
plus : 

use POSIX ":queue"; 

sub F0SS0YEUR { 1 until (waitpid(-l, WNOHANG) == -l) } 

Pour lancer ce code comme il se faut, vous pouvez soit positionnez un gestionnaire 
pour le signal CHLD : 

$SIG{CHLD} = \&F0SS0YEUR; 

ou, si vous etes dans une boucle, arrangez-vous simplement pour appeler le fossoyeur 



4. Si, si c'est vraiment le terme technique consacre. 
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de temps a autre. Ceci est la meilleure approche car elle n'est pas sujette au core dump 
occasionnel que les signaux peuvent parfois declencher dans la bibliotheque C. Toute- 
fois, elle s'avere couteuse si on l'appelle dans une boucle concise, un compromis raison- 
nable consiste done a utiliser une strategic hybride dans laquelle vous minimisez le 
risque a l'interieur du gestionnaire en en faisant le moins possible et en attendant sur 
l'exterieur pour fossoyer les zombies : 

our $zombies = 0; 
$SIG{CHLD} = sub { $zombies++ }; 
sub fossoyeur { 
my $zombie; 

our %Statut_Fils; # Stocke chaque code de retour 
$zombies = 0; 

while (($zombie = waitpid(-l, WNOHANG)) != -l) { 
$Statut_Fils{$zombie} = $?; 

} 

} 

while (l) { 

fossoyeurQ if $zombies; 

} 

Ce code presume que votre noyau implemente des signaux fiables. Ce n'etait tradition- 
nellement pas le cas pour les anciens SysV, ce qui rendait impossible l'ecriture de ges- 
tionnaires de signaux corrects. Depuis la version 5.003, Perl utilise, la oil il est 
disponible, l'appel systeme sigaction(2), qui est bien plus digne de confiance. Cela signi- 
fie qu'a moins que vous ne tourniez sur un ancien systeme ou avec un ancien Perl, vous 
n'aurez pas a reinstaller vos gestionnaires et risquez de manquer des signaux. Heureuse- 
ment, tous les systemes de la famille BSD (y compris Linux, Solaris et Mac OS X) et les 
systemes compatibles POSIX fournissent des signaux fiables, le comportement degrade 
des anciens SysV est done plus une remarque historique qu'un probleme d'actualite. 

Avec ces nouveaux noyaux, beaucoup d'autres choses fonctionnent egalement mieux. 
Par exemple, les appels systeme « lents » (ceux qui peuvent bloquer, comme read, wait 
et accept) redemarreront automatiquement s'ils sont interrompus par un signal. Au 
mauvais vieux temps, le code de Futilisateur devait se souvenir de verifier explicitement 
si chaque appel systeme lent avait echoue ou non, avec $! ($ERRN0) positionne a EINTR 
et, si e'etait le cas, le relancer. Ceci ne se produisait pas seulement avec les signaux INT ; 
meme des signaux inoffensifs comme TSTP (provenant d'un Ctrl-Z) ou CONT (en passant 
la tache en premier plan) auraient fait avorter l'appel systeme. Perl redemarre mainte- 
nant l'appel systeme automatiquement pour vous si le systeme d'exploitation le permet. 
Ceci est generalement decrit comme etant une fonctionnalite. 

Vous pouvez verifier si vous disposez ou non d'un comportement des signaux plus ri- 
goureux, dans le style de POSIX, en chargeant le module Config et en testant si $Con- 
f ig{d_sigaction} est a vrai. Pour trouver si les appels systeme lents sont redemarrables 
ou non, verifiez la documentation de votre systeme a propos de sigaction(2) ou sigvec(3) 
ou denichez SV_INTERRUPT ou SA_RESTART dans votre fichier C sys/signal.h. Si vous trou- 
vez l'un de ces symboles ou les deux, vous avez certainement des appels systeme rede- 
marrables. 
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Minutage des operations lentes 

Une utilisation courante des signaux consiste a imposer une limite de temps aux opera- 
tions s'executant lentement. Si vous etes sur un systeme Unix (ou sur tout autre systeme 
compatible POSIX implementant le signal ALRM), vous pouvez demander au noyau d'en- 
voyer un signal ALRM a votre processus a un moment a venir precis : 

use Fcntl ' :flock'; 
eval { 

local $SIC{ALRM} = sub { die "redemarrage de la minuterie" }; 
alarm 10; # planifie une alarme dans 10 secondes 

eval { 

flock(HFj L0CK_EX) # un verrou exclusif bloquant 
or die "flock impossible : $!"; 

}; 

alarm 0; # annule l'alarme 

}; 

alarm 0; # protection contre une situation de concurrence 

die if $@ && $@ !~ /redemarrage de la minuterie/; # relance 

Si l'alarme est declenchee pendant que vous attendez le verrou et que vous ne faites 
qu'intercepter le signal avant de sortir, vous retournerez directement dans le flock car 
Perl relance automatiquement les appels systeme la oil c'est possible. La seule solution 
est de lever une exception avec die et de laisser ensuite eval l'intercepter. (Ceci fonction- 
ne car l'exception aboutit a un appel de la fonction Iongjmp(3) de la bibliotheque C et 
c'est reellement ce qui vous dispense de relancer Fappel systeme.) 

La capture d'exception imbriquee existe car l'appel de flock leverait une exception si 
flock n'etait pas implemente sur votre plate-forme et vous devez vous assurez d'annuler 
l'alarme dans tous les cas. Le second alarm 0 sert dans le cas oil le signal arrive apres 
avoir lance le flock mais avant d'atteindre le premier alarm 0. Sans le second alarm 0, 
vous prendriez le risque d'avoir une legere situation de concurrence (N.d.T. : race condi- 
tion) — mais le poids ne compte pas dans les situations de concurrence ; soit il y en a, 
soit il n'y en a pas. Et nous preferons qu'il n'y en ait pas. 

Blocage des signaux 

De temps a autre, vous aimeriez bien retarder la reception d'un signal durant une sec- 
tion de code critique. Vous ne voulez pas ignorer le signal aveuglement mais ce que vous 
etes en train de faire est trop important pour etre interrompu. Le hachage %SIG de Perl 
n'implemente pas de blocage des signaux, contrairement au module POSIX, a travers son 
interface a l'appel systeme sigprocmask(2) : 

use POSIX qw(:signal_h); 
$ensemble_signaux = POSIX: :SigSet->new; 

$ensemble_bloques = POSIX : : SigSet>new(SIGINT, SIGOUIT, SIGCHLD) ; 
sigprocmask(SIG_BL0CK, $ensemble_bloques, $ensemble_signaux) 

or die "Impossible de bloquer les signaux INTjOUITjCHLD : $!\n"; 

Une fois que les trois signaux sont bloques vous pouvez faire ce que vous voulez sans 
craindre d'etre embete. Lorsque vous en avez fini avec votre section critique, debloquez 
les signaux en restaurant l'ancien masque de signaux : 
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sigprocmask(SIG_SETMASK, $ensemble_signaux) 

or die "Impossible de restaurer les signaux INT, QUIT, CHLD : $!\n"; 

Si l'un de ces trois signaux etait arrive alors qu'ils etaient bloques, ils sont delivres im- 
mediatement. Si deux signaux ou plus sont en attente, l'ordre de delivrance est indefini. 
De plus, on ne fait aucune distinction entre le fait de recevoir une seule fois un signal 
particulier que Ton a bloque et le recevoir plusieurs fois. 5 Par exemple, si neuf processus 
fils se terminaient pendant que vous bloquiez les signaux CHLD, votre gestionnaire (si 
vous en aviez un) ne serait appele qu'une seule fois apres avoir debloque les signaux. 
C'est pourquoi, lorsque vous fossoyez les zombies, vous devez toujours boucler jusqu'a 
ce qu'ils soient tous partis. 

Fichiers 

Peut-etre n'aviez-vous jamais pense aux fichiers comme etant un mecanisme d'IPC, 
mais ils se taillent la part du lion dans les communications interprocessus — loin devant 
tous les autres precedes reunis. Lorsqu'un processus depose ses precieuses donnees dans 
un fichier et qu'un autre processus les extrait, ces processus ont communique entre eux. 
Les fichiers offrent quelque chose d'unique parmi toutes les formes d'IPC couvertes ici : 
comme un rouleau de papyrus enseveli dans le desert et deterre apres des millenaries, 
un fichier peut etre deterre et lu longtemps apres le deces de celui qui l'a ecrit. 6 En tra- 
vaillant sur la persistance tout en etant d'une facilite d'utilisation comparable, il n'est 
pas surprenant que les fichiers soient toujours populaires. 

L'emploi de fichiers, pour transmettre des informations depuis un passe revolu vers un 
futur incertain, amene quelques surprises. Vous ecrivez le fichier sur un medium per- 
manent, tel qu'un disque, et c'est tout. (Vous pourriez dire a un serveur web ou le trou- 
ver, s'il contient du HTML.) Cela devient un challenge interessant lorsque tous les 
protagonistes sont toujours en vie et essaient de communiquer entre eux. Sans une con- 
vention a propos de celui dont le temps de parole est arrive, toute communication fia- 
ble est impossible ; l'accord peut etre conclu via le verrouillage de fichier, qui sera 
aborde dans le prochain paragraphe. Dans le paragraphe suivant, nous parlerons de la 
relation speciale existant entre un processus pere et ses fils, qui permet a toutes les pro- 
tagonistes d'echanger de l'information via l'heritage de Faeces aux memes fichiers. 

Les fichiers presentent toutefois des limites quand il est question d'acces distant, de syn- 
chronisation, de fiabilite et de suivi des sessions. D'autres paragraphes de ce chapitre 
presentent divers mecanismes d'IPC inventes pour pallier ces limites. 

Verrouillage de fichier 

Dans un environnement multitache, vous devez faire attention a ne pas rentrer en col- 
lision avec d'autres processus essayant d'utiliser le meme fichier que vous. Tant que tous 
les processus ne font que lire, il n'y a aucun probleme, mais des qu'au moins un d'entre 



5. C'est-a-dire, traditionnellement. Les signaux comptabilisables seront peut-etre implemented 
sur des systemes temps-reel d'apres les dernieres specifications mais nous n'avons encore jamais 
vus de tels systemes. 

6. Si tant est qu'un processus puisse deceder. 
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eux a besoin d'ecrire dans le fichier, il s'en suit un chaos complet a moins qu'un quel- 
conque mecanisme de verrouillage ne vienne faire la police. 

Ne vous contentez pas de Fexistence d'un fichier (c'est-a-dire, -e $fichier) comme une 
indication de verrouillage car il existe une situation de concurrence (race condition) entre 
le test de Fexistence de ce nom de fichier et ce que vous avez prevu de faire avec (comme 
le creer, l'ouvrir ou l'effacer). Voir le paragraphe « Gerer les situations de 
concurrences » au chapitre 23, Securite, pour plus d'informations a ce sujet. 

L'interface portable de Perl pour le verrouillage est la fonction flock (HANDLE , DRA- 
PEAUX), decrite au chapitre 29, Fonctions. Pour une portabilite maximale, Perl n'utilise 
que les fonctionnalites de verrouillage les plus simples et les plus largement repandues 
que Ton puisse trouver sur le plus grand eventail de plates-formes. Cette semantique est 
suffisamment simple pour etre emulee sur la plupart des systemes, y compris ceux qui 
n'implementent pas l'appel traditionnel du meme nom, comme System V ou Windows 
NT. (Cependant, si vous tournez sur un systeme Microsoft anterieur a NT, vous n'avez 
probablement aucune chance, vous n'en auriez pas plus si vous etiez sur un systeme Ap- 
ple anterieur a Mac OS X.) 

II existe deux varietes de verrous : les verrous partages (le drapeau L0CK_SH) et les ver- 
rous exclusifs (le drapeau L0CK_EX). Malgre le nom intimidant « exclusif », les processus 
ne sont pas obliges d'obeir aux verrous sur les fichiers. C'est-a-dire que flock n'imple- 
mente qu'un verrouillage consultatif, signifiant que le verrouillage d'un fichier n'empe- 
che pas un autre processus de lire, ni meme d'ecrire dans ce fichier. Une demande de 
verrou exclusif n'est qu'une maniere pour un processus de permettre au systeme d'ex- 
ploitation de bloquer cette demande jusqu'a ce qu'il n'y ait plus de verrous, qu'ils soient 
partages ou exclusifs. De meme, lorsqu'un processus demande un verrou partage, il ne 
fait que se bloquer lui-meme jusqu'a ce qu'il n'y ait plus de verrous exclusifs. Un fichier 
en concurrence ne peut etre accessible de maniere sure que lorsque tous les protagonis- 
tes utilisent le mecanisme de verrouillage de fichier. 

Ainsi, flock est une operation bloquante par defaut. C'est-a-dire que si vous ne pouvez 
obtenir immediatement le verrou que vous desirez, le systeme d'exploitation bloque vo- 
tre processus jusqu'a ce que ce soit possible. Voici comment obtenir un verrou partage, 
bloquant, generalement utilise pour lire un fichier : 

use Fcntl qw(: DEFAULT : flock); 

open(HF, "< nom_f ichier") or die "impossible d'ouvrir nom_f ichier : $!"; 

flock(HF, L0CK_SH) or die "impossible de verrouiller nom_f ichier : $!"; 
# maintenant, lisez le fichier 

Vous pouvez essayer d'acquerir un verrou de maniere non-bloquante en incluant le dra- 
peau L0CK_NB dans la requete flock. S'il est impossible de vous donner le verrou imme- 
diatement, la fonction echoue et renvoie instantanement faux. Voici un exemple : 

flock(HF, L0CK_SH | LOCKNB) 

or die "impossible de verrouiller nom_fichier : $!"; 

Vous pouvez desirer quelque chose d'autre que la levee d'une exception comme nous 
l'avons fait ici mais vous n'oserez certainement pas faire d'entrees/sorties sur le fichier. 
Si le verrou vous est refuse, vous ne devriez pas acceder au fichier jusqu'a ce que vous 
l'obteniez. Qui sait dans quel etat de confusion vous pourriez trouver le fichier ? L'inte- 
ret principal du mode non-bloquant est de vous laisser sortir faire quelque chose d'autre 
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pendant l'attente. Mais il peut egalement s'averer utile pour produire des interactions 
plus amicales en avertissant les utilisateurs que cela pourrait prendre du temps pour ob- 
tenir le verrou afin qu'ils ne se sentent pas abandonnes : 

use Fcntl qw(: DEFAULT : flock); 

open(HF, "< nom_f ichier") or die "impossible d'ouvrir nom_f ichier : $!"; 
unless (flock(HF, L0CK_SH | LOCKJIB)) { 
local $|=1; 

print "Attente d'un verrou sur nom_f ichier. . . "; 

flock(HF, LOCKSH) or die "impossible de verrouiller nom_fichier : $!"; 
print "obtenu.W; 

} 

# maintenant, lisez dans HF 

Certains seront tentes de mettre ce mode non-bloquant dans une boucle. Le probleme 
majeur avec le mode non-bloquant est que, pendant que vous revenez pour verifier a 
nouveau, quelqu'un d'autre a pu s'emparer du verrou parce que vous avez abandonne 
votre place dans la file d'attente. Parfois vous n'avez qu'a vous mettre dans la file et pa- 
tienter. Si vous avez de la chance, il y aura quelques magazines a lire. 

Les verrous s'appliquent sur les handles de fichiers, non sur les noms de fichiers. 7 Lors- 
que vous fermez le fichier, le verrou se dissout automatiquement, que vous ayez ferme 
le fichier explicitement en appelant close ou implicitement en le rouvrant ou en quit- 
tant votre processus. 

Pour obtenir un verrou exclusif, generalement utilise pour ecrire dans un fichier, vous 
devez faire attention. Vous ne pouvez pas utiliser pour cela un open ordinaire ; si vous 
utilisez un mode d'ouverture de <, il echouera sur les fichiers qui n'existent pas encore 
et si vous utilisez >, il ecrasera les fichiers existant deja. Utilisez plutot sysopen sur le fi- 
chier afin qu'il puisse etre verrouille avant d'etre ecrase. Une fois que vous avez ouvert 
le fichier en toute securite pour y ecrire mais que vous n'y avez pas encore touche, ob- 
tenez un verrou exclusif et alors seulement, tronquez le fichier. Maintenant vous pouvez 
l'ecraser avec les nouvelles donnees. 

use Fcntl qw(: DEFAULT : flock); 

sysopen(HF, "nom_f ichier", 0_WR0NLY | OCREAT) 

or die "impossible d'ouvrir nom_fichier : $!"; 
flock(HF, L0CK_EX) 

or die "impossible de verrouiller nom_fichier : $!"; 
truncate(HF, 0) 

or die "impossible de tronquer nom_fichier : $!"; 

# maintenant, ecrivez dans HF 



7. En fait, les verrous ne s'appliquent pas sur des handles de fichiers — ils s'appliquent sur les 
descripteurs de fichiers associes aux handles puisque le systeme d'exploitation ne connait pas les 
handles. Cela signifie que tous vos messages die portant sur l'echec de l'obtention d'un verrou 
sur le non de fichier sont techniquement inapropries. Mais les messages d'erreur de la forme « Je 
ne peux pas obtenir de verrou sur le fichier represents par le descripteur associe au handle 
ouvert a l'origine avec le chemin nom Jichier, bien que nom Jichier puisse maintenant representer 
un fichier totalement different de celui que notre handle represente » ne feraient que semer la 
confusion dans l'esprit de l'utilisateur (sans parler du lecteur). 
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Si vous voulez modifier le contenu d'un fichier sur place, utilisez encore sysopen. Cette 
fois-ci, vous demandez un acces a la fois en lecture et en ecriture, en creant le fichier si 
besoin. Une fois le fichier ouvert mais avant d'avoir fait la moindre lecture ou ecriture, 
obtenez le verrou exclusif et gardez-le durant toute votre transaction. II vaut souvent 
mieux relacher le verrou en fermant le fichier car cela garantit que tous les tampons se- 
ront vides avant que le verrou ne soit relache. 

Une mise a jour implique la lecture d'anciennes valeurs et Fecriture de nouvelles. Vous 
devez accomplir ces deux operations sous un seul verrou exclusif, de peur qu'un autre 
processus ne lise les valeurs (en passe de devenir incorrectes) apres (voire avant) vous, 
mais avant que vous n'ecriviez. (Nous reverrons cette situation quand nous aurons parle 
de la memoire partagee, plus loin dans ce chapitre.) 

use Fcntl qw(: DEFAULT : flock); 

sysopen(HF, "fichier_compteur", ORDWR | 0_CREAT) 

or die "impossible d'ouvrir fichier_compteur : $!"; 
flock(HF, L0CK_EX) 

or die "impossible de verrouiller en ecriture 
f ichier_compteur : $!"; 
$compteur = <HF> | | 0; # serait indefini la premiere fois 
seek(HF, 0, 0) 

or die "impossible de rembobiner f ichier_compteur : $!"; 
print HF Scompteur+l, "\n" 

or die "impossible d'ecrire dans f ichier_compteur : $!"; 

# la prochaine ligne est superflue dans ce programme 

# mais est une bonne idee dans le cas general 
truncate(HF, tell(HF)) 

or die "impossible de tronquer fichier_compteur : $!"; 
close(HF) 

or die "impossible de fermer f ichier_compteur : $!"; 

Vous ne pouvez pas verrouiller un fichier que vous n'avez pas encore ouvert et vous ne 
pouvez pas avoir un verrou unique s'appliquant a plus d'un fichier. Cependant, ce qu'il 
vous est possible de faire est d'utiliser un fichier totalement separe qui se comporterait 
comme une sorte de semaphore, comme un feu de signalisation, et qui fournirait un 
acces controle a quelque chose d'autre a travers des verrous partages et exclusifs sur ce 
fichier semaphore. Cette approche possede de multiples avantages. Vous pouvez avoir 
un fichier verrou qui controle Faeces a de multiples fichiers, evitant le genre de verrou 
mortel (deadlock) survenant lorsqu'un processus essaie de verrouiller ces fichiers dans 
un certain ordre pendant qu'un autre processus essaie de les verrouiller dans un ordre 
different. Vous pouvez utiliser un fichier semaphore pour verrouiller un repertoire en- 
tier. Vous pouvez meme controler Faeces a quelque chose d'autre qui ne soit meme pas 
dans le systeme de fichiers, comme un objet de memoire partagee ou une socket sur la- 
quelle plusieurs serveurs preforkes aimeraient appeler accept. 

Si vous avez un fichier DBM ne fournissant pas son propre mecanisme de verrouillage 
explicite, un fichier verrou auxiliaire est la meilleure facon de controler les acces con- 
currents par de multiples agents. Sinon, le cache interne de votre bibliotheque DBM 
peut se desynchroniser du fichier sur disque. Avant d'appeler dbmopen ou tie, ouvrez et 
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verrouillez le fichier semaphore. Si vous ouvrez la base de donnees avec 0_RD0NLY, vous 
devrez utiliser L0CK_SH pour le verrou. Sinon, utilisez L0CK_EX, pour un acces exclusif 
lors des mises-a-jour dans la base. (Encore une fois, cela ne fonctionne que si tous les pro- 
tagonistes s'entendent pour accorder de l'attention au semaphore.) 

use Fcntl qw( : DEFAULT :flock); 

use DBFile; # seulement pour la demonstration ; toute autre db convient 

$N0M_DB = "chemin/a/la/base"; 
$VERR0U = $N0M_DB . ".verrou"; 

# utilisez 0_RDWR si vous pensez mettre des donnees dans le fichier verrou 
sysopen(DB_VER, $VERR0U, 0_RD0NLY | OCREAT) 

or die "impossible d'ouvrir $VERR0U : $!"; 

# vous devez obtenir le verrou avant d'ouvrir la base 
flock(DB_VER, LOCKSH) 

or die "impossible de verrouiller $VERR0U avec L0CK_SH : $!"; 

tie(%hachage, "DB_File", $N0M_DB, 0_RDWR | OCREAT) 
or die "impossible de lier $N0M_DB : $!"; 

Maintenant vous pouvez en toute securite faire ce que vous voulez avec le %hachage lie. 
Lorsque vous en avez fini avec votre base de donnees, assurez-vous de relacher explicite- 
ment ces ressources et dans l'ordre inverse de celui avec lequel vous les avez acquises : 

untie %hachage; # vous devez fermer la base avant le fichier verrou 
close DB_VER; # maintenant le verrou peut partir en toute securite 

Si la bibliotheque GNU DBM est installee, vous pouvez utiliser le verrouillage implicite 
du module standard GDBM_File. Sauf si le tie initial contient le drapeau GDBM_N0L0CK, 
la bibliotheque s'assure que seul un ecrivain a la fois puisse ouvrir le fichier GDBM et 
que les lecteurs et les ecrivains n'aient pas a la fois la base de donnees ouverte. 

Passage de handles defichiers 

A chaque fois que vous creez un processus fils en utilisant fork, ce nouveau processus 
herite de tous les handles de fichiers ouverts de son pere. L'utilisation des handles de fi- 
chiers pour les communications interprocessus plus facile a illustrer en utilisant tout 
d'abord des fichiers. La comprehension de ce mecanisme est essentielle pour maitriser 
les mecanismes plus elabores des pipes et des sockets, decrits plus loin dans ce chapitre. 

L'exemple le plus simple consiste a ouvrir un fichier et a demarrer un processus fils. Le 
fils utilise alors le handle de fichier deja ouvert pour lui : 

open (ENTREE, "< /etc/motd") or die "/etc/motd : $!"; 
if ($pid = fork) { waitpid($pid,0) } 
else { 

defined($pid) or die "fork : $!"; 
while (<ENTREE>) { print "$. : $_" } 

exit; # empeche le fils de retomber dans le code principal 

} 

# le handle de fichier ENTREE se trouve maintenant a EOF pour le pere 
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Une fois que Faeces a un fichier a ete accorde par open, il le reste jusqu'a la fermeture 
du handle de fichier ; la modification des permissions du fichier ou des privileges d'ac- 
ces n'a aucun effet sur son accessibility. Meme si le processus altere ulterieurement son 
ID d'utilisateur ou de groupe ou si le fichier est transfere a un nouveau proprietaire, cela 
n'affecte pas les handles de fichiers deja ouverts. Les programmes tournant sous des per- 
missions accrues (comme les programmes set-id ou les demons du systeme) ouvrent 
souvent un fichier sous leurs droits accrus et deleguent ensuite le handle de fichier a un 
processus fils qui n'aurait pas pu ouvrir le fichier lui-meme. 

Bien que cette fonctionnalite soit tres pratique lorsqu'elle est utilisee intentionnelle- 
ment, elle peut egalement poser des problemes de securite si les handles de fichiers ont 
des fuites accidentelles d'un programme a l'autre. Pour eviter d'accorder un acces impli- 
cite a tous les handles de fichiers possibles, Perl ferme automatiquement tout handle de 
fichier qu'il a ouvert (y compris les pipes et les sockets) a chaque fois que vous lancez 
avec exec un nouveau programme ou que vous en executez un implicitement avec un 
open sur un pipe, avec system ou avec qx/7 (apostrophes inverses). Les handles de fi- 
chiers du systeme STDIN, STDOUT et STDERR echappent a cette regie car leur fonction pre- 
miere est de fournir un lien dans les communications entre programmes. Un moyen de 
passer un handle de fichier a un nouveau programme consiste done a copier ce handle 
vers un des handles standard : 

open (ENTREE, "< /etc/motd") or die "/etc/motd : $!"; 
if ($pid = fork) { wait } 
else { 

defined($pid) or die "fork : $!"; 

open(STDIN, "<&ENTREE") or die "dup : $!"; 
exec("cat", "-n") or die "exec cat : $!"; 

} 

Si vous voulez vraiment que le nouveau programme acquiere Faeces a un handle de fi- 
chier autre que ces trois-la, e'est possible mais vous devrez faire une ou deux petites cho- 
ses. Lorsque Perl ouvre un nouveau fichier (ou un pipe, ou une socket), il verifie la 
valeur courante de la variable $ A F ($SYSTEM_MAX_FD). Si le descripteur numerique du fi- 
chier utilise par ce nouveau handle de fichier est superieur a $ A F, il est marque comme 
Fun des descripteur qu'il faudra fermer. Sinon, Perl le laisse tranquille et les nouveaux 
programmes que vous lancerez avec exec heriteront de Faeces. 

II n'est pas toujours aussi facile de predire quel descripteur de fichier aura votre handle 
recemment ouvert mais vous pouvez positionner de maniere temporaire votre numero 
maximal pour les descripteurs de fichiers systeme a une valeur immoderement grande 
le temps de faire le open : 

# ouvre le fichier et marque ENTREE comme devant etre 

# conserve entre les exec 
{ 

local $ A F = 10_000; 

open(ENTREEj "< /etc/motd") or die "/etc/motd : $!"; 
} # l'ancienne valeur de $ A F est restauree lorsqu^on sort de la portee 

Maintenant, tout ce qu'il vous reste a faire est d'obtenir que le nouveau programme ac- 
corde de l'attention au numero de descripteur du handle de fichier que vous venez 
d'ouvrir. La solution la plus propre (sur les systemes implementant ceci) consiste a pas- 
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ser un nom de fichier special equivalant a un descripteur de fichier. Si votre systeme 
possede un repertoire nomme /dev/fd ou /proc/$$/fd, contenant des fichiers numerates 
de 0 au numero maximal de descripteurs supported, vous pouvez probablement utiliser 
cette strategic (Beaucoup de systemes d'exploitation Linux ont les deux mais seule la 
version /proc a tendance a etre correctement peuplee. Les systemes BSD et Solaris prefe- 
rent /dev/fd. Vous devrez fureter dans votre systeme pour voir ce qui vous convient le 
mieux.) Ouvrez d'abord votre handle de fichier et marquez-le comme etant Fun de ceux 
a laisser ouverts entre les exec comme dans le code precedent, puis faites un fork com- 
me ceci : 

if ($pid = fork) { wait } 
else { 

defined($pid) or die "fork : $!"; 

$fichier_df = "/dev/fd/" . fileno(ENTREE); 

exec("cat", "-n", $fichier_df) or die "exec cat : $!"; 

} 

Si votre systeme implemente l'appel systeme f cntl, vous pouvez ajuster manuellement 
le drapeau de handle de fichier close-on-exec. Ceci est pratique pour les fois oil vous 
n'avez pas realise lorsque vous avez cree le handle de fichier que vous voudriez le parta- 
ger avec vos fils. 

use Fcntl qw/F_SETFD/; 

fcntl(ENTREE, FSETFD, 0) 

or die "Impossible de mettre a zero le flag close-on-exec 
pour ENTREE : $!\n"; 

Vous pouvez egalement forcer un handle de fichier a se fermer : 

fcntl(ENTREE, F_SETFD, l) 

or die "Impossible de positionner le flag close-on-exec 
pour ENTREE : $!\n"; 

Vous pouvez aussi demander le statut actuel : 

use Fcntl qw/F_SETFD FGETFD/; 

printf ("ENTREE sera %s entre les exec\n", 

fcntl(ENTREEj FGETFD, l) ? "ferme" : "laisse ouvert"); 

Si votre systeme n'implemente pas les descripteurs de fichiers nommes dans le systeme 
de fichiers et que vous voulez passer un handle de fichier autre que STDIN, STDOUT ou 
STDERR, vous pouvez toujours le faire, mais vous devrez proceder a quelques arrange- 
ments speciaux dans votre programme. Les strategies courantes pour ceci consistent a 
passer le numero de descripteur par le biais d'une variable d'environnement ou d'une 
option de la ligne de commande. 

Si le programme execute est en Perl, vous pouvez utiliser open pour convertir un des- 
cripteur de fichier en un handle de fichier. Au lieu de specifier un nom de fichier, uti- 
liser "&=", suivi du numero de descripteur. 

if (defined($ENV{no_df_entree» && $ENV{no_df_entree} =~ / A d$/) { 
open(ENTREEj "<&=$ENV{no_df_entree}") 

or die "fdopen $ENV{no_df entree} en entree impossible : $!"; 

} 
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Cela devient encore plus facile que cela si vous allez lancer un sous-programme ou un 
programme Perl qui attend un nom de fichier comme argument. Vous pouvez utiliser 
la fonctionnalite d'ouverture de descripteur de la fonction ordinaire open de Perl (et 
non sysopen ou la forme a trois argument d'open) pour que cela se fasse automatique- 
ment. Imaginez que vous ayez un simple programme Perl comme ceci : 

#!/usr/bin/perl -p 

# nl - numero de lignes en entree 

printf "%6d ", $.; 

En supposant que vous vous etes arrange pour que le handle ENTREE reste ouvert entre 
les exec, vous pouvez appeler ce programme de cette maniere : 

$df_spec = '<&=' . fileno(ENTREE); 
system("nl", $df_spec); 

ou pour capturer la sortie : 

(Slignes = 'nl J $df_spec ,r ; # les apostrophes empechent le 

# shell d'interpoler dfspec 

Que vous fassiez ou non un exec d'un autre programme, si vous utilisez les descripteurs 
de fichiers herites a travers un fork, il y a un petit pepin. Au contraire des variables co- 
piees a travers un fork, qui deviennent en fait des copies dupliquees mais independan- 
tes, les descripteurs de fichiers sont vraiment les memes dans les deux processus. Si Fun 
des processus lit des donnees depuis le handle, le pointeur de seek (representant la po- 
sition dans le fichier) avance egalement dans Fautre processus et ces donnees ne sont 
plus accessibles par les deux processus. S'ils lisent chacun a leur tour, ils joueront ensem- 
ble a saute-mouton dans le fichier. Intuitivement, cela reste sense pour les handles atta- 
ches a des peripheriques series, des pipes ou des sockets, puisque ceux-ci ont tendance a 
etre des peripheriques en lecture seule avec des donnees ephemeres. Mais ce comporte- 
ment peut vous surprendre avec des fichiers sur disque. Si c'est un probleme, rouvrez 
tout fichier ayant besoin de tracages separes apres le fork. 

L'operateur fork est un concept tire d'Unix, ce qui signifie qu'il peut ne pas etre correc- 
tement implemente sur toutes les plates-formes non-Unix/non-POSIX. Notamment, 
fork ne fonctionne sur les systemes Microsoft que si vous lancer Perl 5.6 (ou une version 
superieure) sur Windows 98 (ou une version ulterieure). Bien que fork soit implemen- 
te sur ces systemes via de multiples flux d'execution concurrents dans le meme pro- 
gramme, il ne s'agit pas des types de taches (threads) oil toutes les donnees sont partagees 
par defaut ; ici, seuls les descripteurs de fichiers le sont. Voir egalement le chapitre 17, 
Threads. 

Pipes 

Un pipe est un canal d'entrees/sorties unidirectionnel pouvant transferer un flux d'oc- 
tets d'un processus a un autre. II existe deux varietes de pipes : les pipes nommes et les 
pipes anonymes. II se peut que vous connaissiez mieux les pipes anonymes, dont nous 
commencerons done par parler. 
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Pipes anonymes 

La fonction open de Perl ouvre un pipe plutot qu'un fichier lorsque vous ajouter un 
symbole de pipe au debut ou a la fin du deuxieme argument d'open. Cela change le reste 
de l'argument en une commande, qui sera interpretee en tant que processus (ou en tant 
qu'ensemble de processus) depuis lequel vous voulez recevoir ou vers lequel vous voulez 
envoyer un flux de donnees via un pipe. Voici comment demarrer un processus fils 
auquel vous avez Fintention d'ecrire : 

open IMPRESSION, "| cat -v | lpr -h 2>/dev/null" 

or die "fork impossible : $!"; 
local $SIG{PIPE} = sub { die "pipe depression casse" }; 
print IMPRESSION "trucs\n"; 

close IMPRESSION or die "mauvaise impression : $! $?"; 

Cet exemple demarre en fait deux processus, nous ecrivons directement dans le premier 
(effectuant cat). Le second processus (effectuant lpr) recoit ensuite la sortie du premier. 
Dans la programmation shell, on appelle frequemment ceci un pipeline. Un pipeline 
peut contenir autant de processus a la suite que vous voulez, pourvu que ceux se trou- 
vant au milieu sachent se comporter comme des filtres ; c'est-a-dire qu'ils sachent lire de- 
puis l'entree standard et ecrire dans la sortie standard. 

Perl utilise le shell par defaut de votre systeme (/bin/sh sur Unix) a chaque fois qu'une 
commande de pipe comprend des caracteres speciaux que le shell prend en compte. Si 
vous ne faites que demarrer une commande et si vous n'avez pas besoin d'utiliser un 
shell — ou si vous ne voulez pas — , vous pouvez plutot employer la forme a plusieurs 
arguments d'un open sur un pipe : 

open IMPRESSION, "|-", "lpr", "-h" # exige Perl 5.6.1 
or die "impossible de lancer lpr : $!"; 

Si vous rouvrez la sortie standard de votre programme en tant que pipe vers un autre 
programme, tout ce que vous afficherez ulterieurement avec print vers STDOUT de- 
viendra l'entree standard du nouveau programme. Ainsi, pour envoyer a un pager la 
sortie de votre programme, 8 vous devez utiliser : 

if (-t STDOUT) { # seulement si stdout est un terminal 

my $pager = $ENV{ PAGER} || 'more'; 

open (STDOUT, "| $pager") or die "fork du pager impossible : $!"; 

} 

END { 

close(STDOUT) or die "impossible de fermer STDOUT : $!" 

} 

Lorsque vous ecrivez dans un handle de fichier connecte a un pipe, fermez toujours ce 
handle explicitement avec close lorsque vous en avez fini avec lui. De cette maniere, 
votre programme principal ne se terminera pas avant sa progeniture. 

Voici comment demarrer un processus fils dans lequel vous avez fintention de lire : 

open STATUT, "netstat -an 2>/dev/null |" 



8. C'est-a-dire, permettre de la consulter un ecran par ecran et non declencher des bips aleatoi- 
res. 
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or die "fork impossible : $!"; 
while (<STATUT>) { 

next if / A (tcp|udp)/; 
print; 

} 

close STATUT or die "mauvais netstat: $! $?"; 

Vous pouvez ouvrir un pipeline sur plusieurs niveaux en entree exactement comme 
vous le pouvez en sortie. Et comme precedemment, vous pouvez eviter le shell en uti- 
lisant une autre forme d'open : 

open STATUT, "-|", "netstat", "-an" # exige Perl 5.6.1 
or die "impossible de lancer netstat : $!"; 

Mais dans ce cas, vous n'aurez pas de redirection des entrees/sorties, ni d'expansion de 
jokers (urilcard), ni de pipes sur plusieurs niveaux, puisque Perl se base sur votre shell 
pour ces fonctionnalites. 

Vous pourriez avoir remarque que vous pouvez utiliser des apostrophes inverses pour 
obtenir le meme effet qu'en ouvrant un pipe en lecture : 

print grep { !/ A (tcp|udp)/ } 'netstat -an 2>&1'; 
die "mauvais netstat" if $?; 

Si les apostrophes sont extremement commodes, le programme lit tout en memoire en 
une seule fois, il est done souvent plus efficace d'ouvrir votre propre handle de fichier 
sur un pipe et de traiter le fichier ligne par ligne ou enregistrement par enregistrement. 
Cela vous donne un controle plus fin sur l'ensemble de l'operation, en vous laissant tuer 
le processus fils plus tot si ca vous plait. Vous pouvez egalement etre plus efficace en trai- 
tant l'entree au fur et a mesure, puisque les ordinateurs savent intercaler diverses ope- 
rations lorsque deux processus ou plus tournent en meme temps. (Meme sur une 
machine avec une seule CPU, les operations d'entrees/sorties peuvent survenir lorsque 
la CPU fait autre chose.) 

Comme vous lancez deux processus ou plus en concurrence, une catastrophe peut frap- 
per le processus fils a n'importe quel moment entre l'ouverture avec open et la ferme- 
ture avec close. Cela signifie que le pere doit verifier la valeur de retour des deux 
fonctions, open et close. La seule verification d'open n'est pas suffisante, puisqu'elle 
vous dirait seulement si la commande a ete lancee avec succes ou non. (Elle ne peut vous 
dire ceci que dans les versions recentes de Perl et seulement si la commande est executee 
directement par le fils et non via le shell.) Le fils rapporte a son pere les catastrophes qui 
interviennent apres cela avec un statut de fin non nul. Lorsque la fonction close voit 
cela, elle sait renvoyer une valeur fausse, indiquant que le veritable statut devrait etre lu 
a partir de la variable $? ($CHI LD_ERR0R). Verifier la valeur renvoyee par close est done 
aussi important que celle renvoyee par open. Si vous ecrivez dans un pipe, vous devriez 
egalement vous preparer a gerer le signal PIPE, qui vous est envoy e si le processus a 
l'autre extremite meurt avant que vous ayez fini de lui transmettre des donnees. 

Soliloque 

Une autre approche de la communication interprocessus consiste a faire soliloquer le 
programme, pour ainsi dire. En fait, votre processus discute avec une copie de lui-meme 
par le biais de pipes. Cela fonctionne largement comme l'open sur un pipe dont nous 
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avons parle au paragraphe precedent, hormis le fait que le processus fils continue a exe- 
cuter votre script plutot qu'une autre commande. 

Pour indiquer ceci a la fonction open, utilisez une pseudo-commande composee d'un 
signe moins. Le second argument d'open ressemble done a « - 1 » ou a « | - », selon que 
vous voulez transmettre des donnees depuis ou vers vous-meme. Comme avec une com- 
mande fork ordinaire, la fonction open renvoie FID du processus fils dans le processus 
pere, mais 0 dans le processus fils. Une autre asymetrie est que le handle de fichier cite 
dans l'open n'est utilise que dans le processus pere. L'extremite du pipe pour le fils est 
rattachee soit a STDIN, soit a STDOUT, selon le cas. C'est-a-dire que si vous ouvrez un pipe 
vers le signe moins, vous pouvez ecrire des donnees dans le handle de fichier que vous 
avez ouvert et votre fils les lira dans STDIN : 

if (open(VERS, "|-")) { 

print VERS $depuis_pere; 

} 

else { 

$vers_fils = <STDIN>; 
exit; 

} 

Si vous ouvrez un pipe depuis le signe moins, vous pouvez lire dans le handle de fichier 
ouvert ce que le fils ecrit dans STDOUT : 

if (open(DEPUIS, "-|")) 
$vers_pere = <DEPUIS>; 

} 

else { 

print STDOUT $depuis_fils; 
exit; 

} 

Une application courante de cette construction est de court-circuiter le shell lorsque 
vous voulez ouvrir un pipe depuis une commande. Vous pourriez vouloir faire ceci car 
vous ne voulez pas que le shell interprete les metacaracteres eventuels dans les noms de 
fichiers que vous essayer de passer a la commande. Si vous tournez sous la version 5.6.1 
de Perl, ou une version superieure, vous pouvez utiliser la forme a plusieurs arguments 
d'open pour obtenir le meme resultat. 

Une autre utilisation d'un open sur un fork consiste a ouvrir un fichier ou une com- 
mande en toute securite alors que vous tournez sous un certain UID ou GID. Le fils que 
vous lancez avec fork abandonne tous les droits d'acces speciaux, puis ouvre en toute 
securite le fichier ou la commande et se comporte comme un intermediate, en passant 
les donnees entre son pere plus puissant et le fichier ou la commande qu'il a ouvert. 
Vous pouvez trouver des exemples dans la section Acceder aux commandes et aux fichiers 
avec des privileges restreints, au chapitre 23. 

Une utilisation pleine de creativite d'un open sur un fork est le filtrage de votre propre 
sortie. Certains algorithmes sont beaucoup plus faciles a implementer en deux passes 
separees plutot qu'en une seule. Voici un exemple simple dans lequel nous emulons le 
programme tee(\) d'Unix en envoyant notre sortie ordinaire vers un pipe. L'agent a 
l'autre extremite du pipe (Fun de vos propres sous-programmes) distribue notre sortie 
vers tous les fichiers specifies : 
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tee("/tmp/truc", "/tmp/machin", "/tmp/bidule"); 

while (<>) { 

print "$ARGV a la ligne $. => $_"; 

} 

close(STDOUT) or die "impossible de fermer STDOUT : $!"; 

sub tee { 

my @sortie = («>_; 

my (Shandies = (); 

for my $chemin (@sortie) { 

my $hf ; # open remplira ceci 
unless (open ($hf, ">", $chemin)) { 

warn "impossible d'ecrire dans $chemin : $!"; 
next; 

} 

push (Shandies, $hf; 

} 

# rouvre STDOUT dans le pere et renvoie 
return if my $pid = open(STDOUT, "|-"); 

die "fork impossible : $!" unless defined $pid; 

# traite STDIN dans le fils 
while (<STDIN>) { 

for my $hf (^handles) { 

print $hf $_ or die "echec de la sortie de tee : $!"; 

} 

} 

for my $hf (^handles) { 

close($hf) or die "echec de la fermeture de tee : $!"; 

} 

exit; # empeche le fils de renvoyer au programme principal ! 

} 

Cette technique peut etre appliquee en boucle pour mettre autant de filtres que vous le 
desirez sur votre sortie. Continuez simplement d'appeler les fonctions qui font un fork- 
open sur STDOUT, ayez le fils qui lit depuis son pere (qu'il voit en tant que STDIN) et passez 
la sortie trituree a la prochaine fonction de la chame. 

Une autre application interessante du soliloque avec fork-open consiste a capturer la 
sortie d'une fonction ayant de mauvaises manieres en envoyant tous ses resultats ecla- 
bousser STDOUT. Imaginez Perl qui n'aurait qu'une fonction printf, sans fonction 
sprintf. Ce dont vous auriez besoin est d'une fonction marchant comme les apostro- 
phes inverses mais avec des fonctions Perl au lieu de commandes externes : 

fonction_mechante("arg"); # zut, ca nous a echappe ! 

$chaine = sub_fork(\&fonction_mechante J "arg"); # capturez-la dans une 

# chaine 

(Slignes = sub_fork(\&fonction_mechante J "arg"); # dans des lignes separees 
sub sub_fork { 
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my $pid_fils = open my $self, "-|"; 

defined $pid_fils or die "fork impossible : $!"; 

shift->((5)_), exit unless $pid_fils; 

local $/ unless wantarray; 

return <$self>; # ferme a la sortie de la portee 

} 

Nous ne pretendons pas que ceci est efficace ; un handle de fichier lie avec tie irait cer- 
tainement bien plus vite. Mais c'est beaucoup plus facile a coder si vous etes plus presse 
que votre ordinateur. 



Communication bidirectionnelle 

Bien que l'emploi d'open, pour se connecter a une autre commande via un pipe, fonc- 
tionne raisonnablement bien pour les communications unidirectionnelles, quid des 
communications bidirectionnelles ? L'approche la plus evidente ne fonctionne pas : 

open(PROG_EN_LECTURE_ECRITURE, "| un programme |") # MAUVAIS ! 

et si vous oubliez d'activer les avertissements, le message de diagnostic passera a la trap- 
pe: 

Can't do bidirectional pipe at monprog line 3. 

La fonction open ne l'autorise pas car cette approche est tout a fait encline a causer des 
verrous mortels (deadlocks) si vous n'etes pas tres attentif. Mais si vous etes determi- 
ne, vous pouvez utiliser le module standard de bibliotheque IPC: :0pen2 pour rattacher 
deux pipes aux STDIN et STDOUT d'un sous-processus. II existe egalement IPC: :0pen3 
pour les entrees/sorties tridirectionnelles (vous permettant egalement de capturer le 
STDERR de votre fils fils) mais ce dernier exige soit une boucle select embarrassee, soit 
le module IO::Select, plus commode. Mais vous devrez alors eviter les operations dans 
le tampon d'entree de Perl, comme <> (readline). 

Voici un exemple utilisant open2 : 

use IPC: :0Pen2; 

local (*Lecteur, *Ecrivain); 

$pid = open2(\*Lecteur, \*Ecrivain, "be -1"); 

$somme = 2; 

for (1 .. 5) { 

print Ecrivain "$somme * $somme\n"; 

chomp($somme = <Lecteur>); 

} 

close Ecrivain; 

close Lecteur; 

waitpid($pidj 0); 

print "La somme vaut $somme\n"; 

Vous pouvez egalement autovivifier des handles de fichiers lexicaux : 

my ($hf_lecture, $hf_ecriture); 

$pid = open2($hf_lecture, $hf_hf_ecriture, "cat -u -n"); 

Generalement le probleme avec ceci est que le vidage de tampon standard des entrees/ 
sorties va vraiment gacher votre journee. Meme si votre handle de fichier de sortie est 
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automatiquement vide (la bibliotheque le fait pour vous) de sorte que le processus a 
l'autre extremite recevra vos donnees de maniere opportune, vous ne pouvez generale- 
ment rien faire pour l'obliger a vous retourner la politesse. Dans ce cas particulier, nous 
avons de la chance : be s'attend a manipuler un pipe et sait vider (flush) chaque ligne de 
sortie. Mais peu de commandes sont concues de la sorte, cela fonctionne done rarement 
a moins d'ecrire vous-meme le programme a l'autre extremite du pipe bidirectionnel. 
Meme les simples programmes apparemment interactifs, comme ftp, echouent ici car 
ils ne videront pas leur tampon ligne par ligne dans un pipe. II ne le feront que sur un 
peripherique tty. 

Les modules de CPAN 10 : : Pty et Expect peuvent vous venir en aide car ils fournissent 
un vrai tty (en fait, un vrai pseudo-tty mais se comportant comme un vrai). Cela vous 
donne un vidage de tampon ligne par ligne dans l'autre processus, sans modifier son 
programme. 

Si vous eclatez votre programme en plusieurs processus et que vous voulez qu'ils aient 
tous ensemble une conversation allant dans les deux sens, vous ne pouvez pas utiliser 
les interfaces de haut niveau de Perl, car ces dernieres sont toutes unidirectionnelles. 
Vous devrez utilisez deux appels de fonction pipe, de bas niveau, chacun manipulant 
une direction dans la conversation : 

pipe(DEPUIS_PERE, VERSJILS) or die "pipe : $!"; 
pipe^DEPUISJILS, VERSPERE) or die "pipe : $!"; 

select((select(VERS_FILS), $| = l))[o]); # vidage automatique 

select((select(VERS_PERE), $| = l))[o]); # vidage automatique 

if ($pid = fork) { 

close DEPUISPERE; close VERS_PERE; 

print VERS_FILS "Pid $$ du pere envoie ceci\n"; 

chomp($ligne = <DEPUIS_FILS>); 

print "Pid $$ du pere vient de lire ceci : f $ligne J \n"; 
close DEPUIS_FILS; close VERS>FILS; 
waitpid($pid,o); 
} else { 

die "fork impossible : $!" unless defined $pid; 
close DEPUISJILS; close VERSFILS; 
chomp($ligne = <DEPUIS_PERE>); 

print "Pid $$ du fils vient de lire ceci : r $ligne J \n"; 
print VERSPERE "Pid $$ du fils envoie ceci\n"; 
close DEPUISPERE; close VERSPERE; 
exit; 

} 

Sur la plupart des systemes Unix, vous n'avez en fait pas a faire deux appels pipe separes 
pour accomplir une communication bidirectionnelle complete (full duplex) entre un 
pere et son fils. L'appel socketpair fourni des connexions bidirectionnelles entre des 
processus associes sur la meme machine. Ainsi, plutot que deux pipe, vous n'avez besoin 
que d'un socketpair : 

use Socket; 

socketpair(Fils, Pere, AFJJNIX, S0CK_STREAM, PFUNSPEC) 
or die "socketpair: $!"; 
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# ou laissez Perl choisir les handles de fichiers pour vous 
my ($hf_fils, $hf_pere); 

socketpair($hf_fils J $hf_pere, AF_UNIX, SOCKSTREAM, PF_UNSPEC) 
or die "socketpair : $!"; 

Apres le fork, le pere ferme le handle Pere, puis lit et ecrit via le handle Fils. Pendant 
ce temps, le fils ferme le handle Fils, puis lit et ecrit via le handle Pere. 

Pipes nommes 

Un pipe nomme (souvent appele FIFO) est un mecanisme pour mettre en place un con- 
versation entre des processus sans rapport les uns avec les autres, sur la mime machine. 
Les noms en question existent dans le systeme de fichiers, ce qui est une maniere amu- 
sante de dire que vous pouvez mettre un fichier special dans le systeme de fichiers, sous- 
tendant un processus plutot qu'un disque. 9 

Un FIFO est pratique lorsque vous voulez connecter un processus a un autre qui n'a 
aucun rapport. Lorsque vous ouvrez un FIFO, votre processus bloquera jusqu'a ce qu'il 
y ait un processus a l'autre extremite. Ainsi, si un lecteur ouvre en premier un FIFO, il 
bloquera jusqu'a ce que l'ecrivain apparaisse — et vice-versa. 

Pour creer un pipe nomme, utilisez la fonction mkf ifo de POSIX — enfin, si vous etes 
sur un systeme POSIX. Sur les systemes Microsoft, vous pourrez a la place regarder le 
module Win32: :Pipe, qui, malgre les apparences, cree des pipes nommes. (Les utilisa- 
teurs de Win32 creent des pipes anonymes en employant pipe, tout comme le reste 
d'entre nous.) 

Par exemple, mettons que vous aimeriez que votre fichier .signature produise une re- 
ponse differente a chaque fois qu'il est lu. Vous n'avez qu'a le mettre en pipe nomme 
avec un programme Perl a l'autre extremite crachant des aphorismes au hasard. Main- 
tenant, a chaque fois qu'un programme quelconque (comme en logiciel envoyant des 
mails, un lecteur de forums de discussion, un programme finger, et ainsi de suite) essaye- 
ra de lire dans ce fichier, ce programme se connectera au votre et lira une signature dy- 
namique. 

Dans l'exemple suivant, nous utilisons l'operateur de test de fichier -p, que Ton rencon- 
tre rarement, pour determiner si quelqu'un (ou quelque chose) a supprime accidentel- 
lement notre FIFO. 10 Si c'est le cas, il n'y a aucune raison pour essayer de l'ouvrir, nous 
traiterons done ceci comme une demande de terminaison. Si nous utilisions une simple 
fonction open avec un mode valant « +> $chemin_f », il y aurait une minuscule situa- 
tion de concurrence (race condition) qui risquerait de creer la signature en tant que sim- 
ple fichier s'il disparaissait entre le test -p et l'ouverture. Nous ne pourrions pas non 
plus utiliser un mode valant « +< $chemin_f » car l'ouverture d'une FIFO en lecture- 
ecriture est non-bloquante (ceci n'est vrai que pour les FIFO). En utilisant sysopen et en 
omettant le drapeau 0_CREAI nous evitons ce probleme en ne creant jamais de fichier 



9. Vous pouvez utiliser la meme chose avec des sockets dans le domaine Unix mais vous ne pou- 
vez pas utiliser open sur ces derniers. 

10. Une autre utilisation consiste a voir si un handle de fichier est connecte a un pipe, nomme 
ou anonyme, comme dans - p STDIN. 
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par accident. 

use Fcntl; # pour sysopen 

chdir; # au repertoire « maison » 

$chemin_f = '.signature''; 

$ENV{PATH} .= ":/usr/games"; 

unless (-p $chemin_f) { # pas un pipe 

if (-e _) { # mais quelque chose d'autre 

die "$0 : n'ecrasera pas .signature\n"; 
} else { 

require POSIX; 

POSIX: :mkfifo($chemin_f, 0666) 

or die "mknod $chemin_f impossible: $!"; 
warn "$0 : a cree $chemin_f en tant que pipe nommeAn"; 

} 

} 

while (l) { 

# quitte si le fichier signature est supprime manuellement 
die "Le fichier pipe a disparu" unless -p $chemin_f; 

# la prochaine ligne bloque s'il n'y a pas de lecteur 
sysopen(FIFO J $chemin_f J OWRONLY) 

or die "Impossible d'ecrire dans $chemin_f: $!"; 
print FIFO "Gerard Lambert (lambert\(5>machine.org)\n" , 'fortune -s'; 
close FIFO; 

select(undef , undef, undef, 0.2); # dort l/5eme de seconde 

} 

La courte sieste apres la fermeture du FIFO est necessaire pour laisser au lecteur une 
chance de lire ce qui a ete ecrit. Si nous avions recommence la boucle immediatement 
et rouvert le FIFO avant que notre lecteur ait fini de lire les donnees que nous venions 
d'envoyer, nous n'aurions pas vu de fin de fichier (end-offile) car il y aurait encore un 
ecrivain. Nous aurions boucle tous les deux encore et encore jusqu'a ce qu'a une itera- 
tion donnee, l'ecrivain arrive un peu apres et que le lecteur voie cette fin de fichier in- 
saisissable. (Et nous nous sommes inquietes a propos des situations de concurrence ?) 

IPC System V 

Tout le monde deteste les IPC System V Elles sont plus lentes que des cartes perforees, 
se taillent de petits espaces de noms insidieux sans aucun rapport avec le systeme de fi- 
chiers, utilisent des numeros hostiles a l'entendement humain pour nommer leurs ob- 
jets et perdent constamment le fil de leurs propres pensees. Et de temps a autre, votre 
administrateur systeme doit se lancer dans une operation de ratissage pour rechercher 
et de detruire ces objets perdus d'IPC SysV avec ipcs(l) et les tuer avec ipcrm(l), avant 
que le systeme n'ait plus de memoire, si tout va bien. 

Malgre tous ces maux, les antiques IPC SysV ont toujours des applications valides. Les 
trois sortes d'objets d'IPC sont la memoire partagee, les semaphores et les messages. 
Pour la transmission de messages, on preferera de nos jours le mecanisme de sockets qui 
est en outre beaucoup plus portable. Pour les utilisations simples des semaphores, on a 
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plutot tendance a utiliser le systeme de fichiers. Quant a la memoire partagee — en fait, 
vous avez maintenant un probleme. Si vous Favez, l'appel systeme mmap(2), plus mo- 
derne, remplit ce contrat 11 mais la qualite de l'implementation varie d'un systeme a 
l'autre. II requiert en outre un peu d'attention pour que Perl evite de reallouer vos chai- 
nes depuis Fendroit ou mmap{2) les a mises. Mais lorsque les programmeurs envisagent 
d'utiliser mmap(2), ils entendent marmonner de maniere incoherente les gourous lo- 
caux sur le fait que mmap souffre de problemes epineux avec la coherence de cache s'il 
manque quelque chose appele un « cache de tampon unifie » (unified buffer cache) — a 
moins que ce ne soit une « tache d'unite de canton » (flycatcher unibus) — et, ref lechis- 
sant sur le fait que Ton sait ce qu'on perd mais qu'on ne sait pas ce qu'on trouve, ils re- 
tournent vite aux IPC SysV qu'ils connaissent et detestent pour tous leurs besoins en 
memoire partagee. 

Voici un petit programme demontrant faeces controle a un tampon en memoire parta- 
ge par une nichee de processus apparentes. Les objets d'IPC SysV peuvent egalement 
etre partages entre des processus sans rapport les uns avec les autres, sur le meme ordi- 
nateur, mais vous devez alors imaginer comment ils vont se trouver les uns les autres. 
Nous creerons un semaphore par entite, qui servira d'intermediaire pour un acces secu- 
rise. 12 

A chaque fois que vous voulez recuperer ou mettre une nouvelle valeur en memoire 
partagee, vous devez passer d'abord par le semaphore. Ceci peut devenir un peu penible, 
nous enroberons done Faeces dans une classe d'objets. Le module IPC: : Shareable va 
encore plus loin en enrobant sa classe d'objets dans une interface tie. 

Ce programme tourne jusqu'a ce que vous l'interrompiez avec un Ctrl-C ou un equiva- 
lent : 

#!/usr/bin/perl -w 

use V5.6.0; # ou une version superieure 

use strict; 

use sigtrap qw(die INT TERM HUP QUIT); 
my $PROGENITURE = shift(@ARGV) || 3; 

eval { main() }; # voir DESTROY ci-dessous pour comprendre pourquoi 
die if $@ && $@ !~ / A SIG recu/; 
print "\nFini.\n"; 
exit; 

sub main { 

my $mem = ShMem->allouer("Creation Originale a " . localtime); 
my((5irejetons J $fils); 
$SIG{CHLD} = 'IGNORE'; 

for (my $embryon = $PROGENITURE; $embryon > 0; $embryon--) { 



11. II y a meme un module Mmap sur CPAN. 

12. II serait plus realiste de creer une paires de semaphores pour chaque morceau de memoire 
partagee : un pour la lecture et l'autre pour l'ecriture. Et, en fait, e'est ce que fait le module de 
CPAN IPC : : Shareable. Mais nous essayons ici de rester simples. Cependant il vaut mieux admet- 
tre qu'avec un couple de semaphores, vous pourriez alors faire usage d'a peu pres le seul benefice 
des IPC SysV : vous pourriez executer des operations atomiques sur des ensembles entiers de 
semaphores comme s'il s'agissait d'un seul element, ce qui est parfois bien utile. 
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if ($fils = fork) { 

print "$$ engendra $fils\n"; 
next; 

} 

die "fork impossible : $!" unless defined $fils; 
eval { 

while (l) { 

$mem->verrouiller(); 

$mem->positionner("$$ " . localtime) 

unless $mem->consulter =~ / A $$\b/o; 

$mem->deverrouiller(); 

} 

}; 

die if $@ && $@ !~ / A SIG recu/; 
exit; # mort du fils 

} 

while (l) { 

print "Le tampon vaut ", $mem->recuperer, "\n"; 
sleep 1; 

} 

} 

Et void le paquetage ShMem, que ce programme utilise. Vous n'avez qu'a l'epingler a la 
fin du programme ou le mettre dans son propre fichier (avec un « 1; » a la fin) et le 
charger avec require depuis le programme principal. (On trouve les deux modules 
d'IPC qu'il utilise a son tour dans la distribution standard de Perl.) 

package ShMem; 

use IPC::SysV qw(IPC_PRIVATE IPC_RMID IPC_CREAT S_IRWXU); 
use IPC: : Semaphore; 
sub MAXBUFQ { 2000 } 

sub allouer { # constructeur 
my $classe = shift; 
my $valeur = @_ ? shift : "; 

my $clef = shmget(IPC_PRIVATE, MAXBUF, S_IRWXU) or die "shmget : $!"; 
my $sem = IPC: : Semaphore- >new(IPC_PRIVATE, 1, S_IRWXU | IPC_CREAT) 

or die "IPC: :Semaphore->new : $!"; 
$sem->setval(0,l) or die "sem setval : $!"; 

my $obj = bless { 

PROPRIETAIRE => $$, 

SHMKEY => $clef, 

SEMA => $sem, 
} => $classe; 

$obj->mettre($valeur) ; 
return $obj; 

} 
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Maintenant, passons aux methodes de collecte et de stockage. Les methodes recolter 
et mettre verrouillent le tampon, contrairement aux methodes consulter et position- 
ner, ces dernieres ne devraient done etre utilisees que lorsque l'objet est verrouille ma- 
nuellement — ce que vous devez faire lorsque vous voulez aller chercher une ancienne 
valeur et remettre une version modifiee, tout cela avec le meme verrou. Le programme 
de demonstration fait ceci dans sa boucle while (l) . La transaction complete doit se de- 
rouler avec le meme verrou sinon le test et le positionnement ne seraient pas atomiques 
et pourraient exploser. 

sub recolter { 

my $obj = shift; 

$obj->verrouiller; 

my $valeur = $obj->consulter((5)_); 

$obj->deverrouiller; 

return $valeur; 

} 

sub consulter { 

my $obj = shift; 

shmread^obj-MSHMKEY}, my $tampon=", 0, MAXBUF) 

or die "shmread : $!"; 
substr($tampon, index($tampon, "\0")) = 
return $tampon; 

} 

sub mettre { 

my $obj = shift; 
$obj->verrouiller; 
$obj->positionner(|5)_); 
$obj->deverrouiller; 

} 

sub positionner { 

my($obj J $msg) = §_; 

shmwrite($obj->{SHMKEY} J $msg, 0, MAXBUF) or die "shmwrite : $!"; 

} 

sub verrouiller { 
my $obj = shift; 

$obj->{SEMA}->op(0,-l,0) or die "semop : $!"; 

} 

sub deverrouiller { 
my $obj = shift; 

$obj->{SEMA}->op(0 J l,0) or die "semop : $!"; 

} 

Finalement, la classe a besoin d'un destructeur pour que, lorsque l'objet disparait, nous 
puissions manuellement desallouer la memoire partagee et le semaphore stocke a l'in- 
terieur de l'objet. Sinon, ils survivront a leur createur et vous devrez recourir a ipes et 
ipcrm (ou un administrateur systeme) pour vous debarrasser d'eux. C'est pourquoi nous 
somme passes par les enrobages elabores dans le programme principal pour convertir 
les signaux en exceptions : pour que tous les destructeurs soient lances, que tous les ob- 
jets d'IPC SysV soient desalloues et que les administrateurs systeme ne s'occupent pas 
de notre cas. 
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sub DESTROY { 

my $obj = shift; 

return unless $obj->{PROPRIETAIRE} == $$; # evite les deallocations 

# redondantes 

shmctl($obj->{SHMKEY}, IPC_RMID, 0) or warn "shmctl RMID : $!"; 
$obj->{SEMA}->remove() or warn "sema->remove : $!"; 

} 

Sockets 

Les mecanismes d'IPC dont nous avons discute auparavant souffrent tous d'une impor- 
tante restriction : ils sont concus pour un communication entre des processus tournant 
sur le meme ordinateur. (Meme si les fichiers peuvent parfois etre partages entre les ma- 
chines a travers des mecanismes comme NFS, le verrouillage echoue lamentablement 
sur la plupart des implementations de NFS, ce qui annihile une grande part des plaisirs 
des acces concurrents.) Pour des communications generiques sur le reseau, les sockets 
sont la solution de choix. Bien que les sockets aient ete inventees sur BSD, elles se sont 
rapidement repandues aux autres formes d'Unix et de nos jours, vous pouvez trouver 
une interface pour les sockets sur a peu pres tous les systemes d'exploitations viables ici- 
bas. Si vous n'avez pas de sockets sur votre machine, vous allez rencontrer d'enormes dif- 
ficultes pour utiliser l'lnternet. 

Avec les sockets, vous pouvez communiquer a la fois avec des circuits virtuels (les flux 
ou streams TCP) et avec des datagrammes (les paquets UDP). Votre systeme vous permet 
peut-etre d'en faire plus encore. Mais le type de programmation socket le plus courant 
utilise TCP sur des sockets du domaine Internet, c'est done celui que nous detaillerons 
ici. De telles sockets fournissent des connexions fiables fonctionnant un peu comme 
deux pipes bidirectionnels qui ne seraient pas limites a une seule machine. Les deux ap- 
plications reines (killer apps) de l'lnternet, l'email et le surf sur le Web, reposent pres- 
qu'exclusivement sur des sockets TCP. 

Vous utilisez aussi largement UDP sans le savoir. Chaque fois que votre machine essaie 
de trouver un site sur l'lnternet, elle envoie des paquets UDP a votre serveur DNS pour 
lui demander la veritable adresse IP Vous pourriez utiliser UDP vous-meme lorsque 
vous voulez envoyer et recevoir des datagrammes. Les datagrammes sont plus economi- 
ques que les connexions TCP precisement parce qu'ils ne sont pas orientes connexion ; 
e'est-a-dire qu'ils ressemblent moins a un appel telephonique qu'a un depot de lettre 
dans une boite. Mais il manque egalement a UDP la fiabilite offerte par TCP, ce qui le 
rend plus approprie pour les situations oil vous ne vous souciez pas si un ou deux pa- 
quets se retrouvent happes, broyes et engloutis. Ou lorsque vous savez qu'un protocole 
de plus haut niveau fera respecter un certain degre de redondance ou d'echec en dou- 
ceur (ce que fait DNS). 

D'autres choix sont disponibles mais bien moins courants. Vous pouvez utilisez des soc- 
kets du domaine Unix mais elles ne fonctionnent que pour les communications locales. 
Divers systemes implementent divers autres protocoles qui ne sont pas bases sur IP 
Ceux-ci interessent sans doute quelqu'un quelque part pour faire quelque chose mais 
nous devons nous restreindre quelquefois. 

Les fonctions Perl s'occupant des sockets ont les memes noms que les appels systeme 
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correspondants en C, mais leurs arguments ont tendance a differer pour deux raisons : 
premierement, les handles de fichiers de Perl fonctionnent differemment des descrip- 
teurs C ; deuxiemement, Perl connait deja la longueur de ses chaines et il est done inu- 
tile de passer cette information. Voir les details sur chaque appel systeme relatif aux 
sockets au chapitre 29. 

Avec du code Perl ancien, on devait utiliser des valeurs codees en dur pour passer des 
constantes aux fonctions des sockets, ce qui annihilait la portability. Comme la plupart 
des appels systeme, ceux relatifs aux sockets renvoient discretement mais poliment un- 
def lorsqu'ils echouent, au lieu de lever une exception. II est done essentiel de verifier 
les valeurs renvoyees par ces fonctions, puisque si vous les jetez a la poubelle, elles 
n'iront pas crier cet echec sur les toits. Si jamais vous voyez du code faisant quelque cho- 
se comme positionner explicitement $AF_INET = 2, vous savez que vous etes dans les 
problemes jusqu'au cou. Une approche d'une superiorite incommensurable consiste a 
utiliser le module Socket ou le module encore plus sympathique 10 : : Socket, tous deux 
standard. Ces modules fournissent diverses constantes et des fonctions d'aide dont vous 
aurez besoin pour mettre en place des clients et des serveurs. Pour une reussite optima- 
le, vos programmes de sockets devraient toujours commencer ainsi (n'oubliez pas non 
plus d'ajouter l'option de verification de marquage -T sur la ligne shebang (commencant 
par # ! ) pour les serveurs) : 

#!/usr/bin/perl -w 
use strict; 
use sigtrap; 

use Socket; # ou I0::Socket 

Comme nous Favons fait remarquer ailleurs, Perl est a la merci de vos bibliotheques C 
pour la plupart de ses fonctionnalites concernant le systeme, et tous les systemes n'im- 
plementent pas toutes les sortes de sockets. II est probablement plus sur de s'en tenir 
avec les operations sur les sockets normales TCP et UDR Par exemple, si vous voulez que 
votre code ait une chance d'etre portable vers des systemes auxquels vous n'avez pas pen- 
se, ne vous attendez pas a ce qu'ils implementent un protocole fiable avec des paquets 
sequences. Ne vous attendez pas non plus a passer des descripteurs de fichiers ouverts 
entre des processus n'ayant aucun rapport les uns avec les autres sur des sockets du do- 
maine Unix. (Si, si, vous pouvez vraiment faire cela sur de nombreuses machines Unix 
— voir recvmsg(2) dans votre page de manuel locale.) 

Si vous voulez juste utiliser un service standard de l'lnternet comme le mail, les forums 
de discussion, le service de noms de domaine, FTP, Telnet, le Web et ainsi de suite, alors 
plutot que de repartir de zero, essayez d'utiliser les modules existants de CPAN. Les mo- 
dules tout faits, concus pour cela, comprennent : Net:: SMTP (ou Mail: : Mailer), 
Net : NNTP, Net : : DNS, Net : : FTP, Net : : Telnet et les divers modules relatifs a HTTP Les fa- 
milies de modules libnet et libww comprennent toutes deux de nombreux modules in- 
dividuels pour la communication en reseau. Les zones de modules sur CPAN qui 
peuvent vous interesser sont dans la section 5 sur la Communication en reseau et dans 
la section 15, sur les Utilitaires de serveurs et de demons. 

Dans les paragraphes qui suivent, nous presentons plusieurs exemples de clients et de 
serveurs sans grande quantite d'informations sur chaque fonction utilisee car ce serait 
en grande partie une recopie pure et simple de ce que nous avons deja ecrit au chapitre 
29, Fonctions. 
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Clients en reseau 

Utilisez les sockets du domaine Internet lorsque vous voulez une communication 
client/serveur fiable entre des machines potentiellement differentes. 

Pour creer un client TCP se connectant a un serveur quelque part, il est d'ordinaire plus 
facile d'utiliser le module standard 10: : Socket: :INET : 

use 10:: Socket ::INET; 

$socket = 10: : Socket : :INET->new(PeerAddr => $hote_distant, 

PeerPort => $port_distant, 
Proto => "tcp", 
Type => S0CK_STREAM) 
or die "N'a pas pu se connecter a $hote_distant:$port_distant : $!\n"; 

# envoie quelque chose sur la socket, 

print $socket "Pourquoi ne m'appelles-tu plus jamais ?\n"; 

# lit la reponse distante, 
$reponse = <$socket>; 

# et termine la connexion lorsque nous avons fini 
close($socket) ; 

Un raccourci pour l'appel est suffisant lorsque vous n'avez que l'hote et le port auxquels 
se connecter et que vous voulez utiliser les valeurs par defaut pour les autres champs : 

$socket = 10: :Socket: :INET->new("www. google. org:80") 

or die "N^a pas pu se connecter au port 80 de google: $!"; 

Pour se connecter en utilisant le module Socket : 

use Socket; 

# cree une socket 

socket(Serveur, PFINET, S0CKSTREAM, getprotobyname('tcp')); 

# construit l'adresse de la machine distante 
$adr_internet = inet_aton($hote_distant) 

or die "N'a pas pu convertir $hote_distant en adresse Internet : $!\n"; 
$adr_p = sockaddr_in($port_distantj $adr_internet); 

# se connecte 
connect(Serveurj $adr_p) 

or die "N'a pas pu se connecter a $hote_distant:$port_distant : $!\n"; 

select((select(Serveur) , $| = l)[o]); # active la mise en tampon 

# des commandes 

# envoie quelque chose sur la socket 

print Serveur "Pourquoi ne m'appelles-tu plus jamais ?\n"; 

# lit la reponse distante 
$reponse = <Serveur>; 
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# et termine la connexion lorsque nous avons fini 
close(Serveur) ; 

Si vous ne voulez fermer que votre cote de la connexion, pour que l'extremite distante 
reste recoive une fin de fichier mais que vous puissiez continuer a lire les donnees ve- 
nant du serveur, utilisez l'appel systeme syscall pour une demi-fermeture : 

# plus cFecriture vers le serveur 

shutdown(Serveur, l); # constante Socket: :SHUT_WR dans la v5.6 

Serveurs en reseau 

Voici le serveur correspondant qui va avec. II est assez simple grace a la classe standard 
10:: Socket ::INET: 

use 10:: Socket ::INET; 

$serveur = 10: : Socket : :INET->new(LocalPort => $port_serveur, 

Type => SOCKSTREAM, 

Reuse => 1, 

Listen => 10 ) # ou S0MAXC0NN 
or die "N'a pas pu etre un serveur TCP sur le port $port_serveur : $!\n"; 

while ($client = $serveur->accept()) { 

# $client est la nouvelle connexion 

} 

close($serveur); 

Vous pouvez egalement ecrire cela en utilisant le module Socket, de plus bas niveau : 
use Socket; 

# cree la socket 

socket(Serveur, PFINET, S0CK_STREAM, getprotobyname('tcp')); 

# pour pouvoir redemarrer rapidement notre serveur 
setsockopt(Serveur, S0L_S0CKET, SOREUSEADDR, l); 

# construit l'adresse de la socket 

$mon_adr = sockaddr_in($port_serveur, INADDR_ANY)j 
bind(Serveurj $mon_adr) 

or die "N'a pas pu s'attacher au port $port_serveur : $!\n"; 

# etablit une file pour connexions entrantes 
listen(Serveur, S0MAXC0NN) 

or die "N'a pas pu ecouter sur le port $port_serveur : $!\n"; 

# accepte et traite les connexions 
while (accept(Clientj Serveur)) { 

# Fait quelque chose avec la nouvelle connexion Client 

} 

close(Server); 
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Le client n'a pas besoin de s'attacher avec bind a une adresse particuliere, par contre c'est 
le cas pour le serveur. Nous avons specifie son adresse en tant que INADDR_ANY, ce qui 
signifie que les clients peuvent se connecter depuis n'importe quelle interface reseau 
disponible. Si vous voulez vous placer devant une interface particuliere (comme le cote 
externe d'une passerelle ou d'une machine pare-feux (firewall)), utilisez plutot l'adresse 
reelle de cette interface. (Les clients peuvent egalement faire cela mais en ont rarement 
besoin.) 

Si vous voulez savoir quelle machine s'est connectee avec vous, appelez getpeername sur 
la connexion du client. Ceci renvoie une adresse IP, que vous devrez convertir vous- 
meme vers un nom (si vous le pouvez) : 

use Socket; 

$autre_extremite = getpeername(Client) 

or die "N'a pas pu identifier l'autre extremite : $!\n"; 
($port, $adr_i) = unpack_sockaddr_in($autre_extremite); 
$ip_reelle = inet_ntoa($adr_i); 

$nom_hote_pretendu = gethostbyaddr($adr_i, AF_INET); 

Ceci etre usurpe (spoofable) de maniere triviale car le proprietaire de cette adresse IP 
peut initialiser ses tables d'inversion (reverse tables) pour qu'elles disent ce qu'il veut. 
Une petite mesure pour s'assurer de la validite de l'adresse IP consiste a faire la conver- 
sion inverse : 

@recherche_noms = gethostbyname($nom_hote_pretendu) 

or die "N'a pas pu faire la conversion inverse de $nom_hote_pretendu : 
$!\n"; 

@ips_resolues = map{inet_ntoa($_)} $recherche_noms[ 4 .. $#recherche_noms ]; 
$usurpation_potentielle = !gre e eq $_ } @ips_resolues; 

Une fois qu'un client s'est connecte a votre serveur, ce dernier peut faire des entrees/sor- 
ties a la fois depuis et vers ce handle client. Mais pendant que le serveur est ainsi occupe, 
il ne peut plus servir de requetes entrantes provenant d'autres clients. Pour eviter de Tes- 
ter bloque sur un seul client a la fois, de nombreux serveurs se clonent, avec fork, pour 
s'occuper de chaque connexion entrante. (D'autres anticipent les fork ou multiplexent 
les entrees/sorties entre plusieurs clients en utilisant l'appel systeme select.) 

REQUETE: 

while (accept (Client^ Serveur)) { 
if ($pid_fils = fork) { 

close Client; # le pere ferme le handle inutilise 

next REOUETE; 

} 

def ined($pid_f ils) or die "fork impossible : $!" ; 

close Serveur; # le fils ferme le handle inutilise 

select(Client); # nouveau handle par defaut pour les affichages 

$|=1; # vidage de tampon automatique 

# le code par connexion des fils fait ses entrees/sorties avec le 

# handle Client 
$entree = <Client>; 
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print Client "affichage\n"; # ou STDOUT, c'est la meme chose 

open(STDIN, "«&Client") 

or die "impossible de dupliquer le client : $!"; 
open(STDOUT, ">&Client") 

or die "impossible de dupliquer le client : $!"; 
open(STDERRj ">&Client") 

or die "impossible de dupliquer le client : $!"; 



# lance la calculatrice, ce n'est qu'un exemple 

system("bc -1"); # ou ce que vous preferez, pourvu 

# qu'il n'y ait pas de sequences 

# d'echappement du shell ! 
print "fini\n"; # toujours au client 

close Client; 

exit; # empeche le fils de retourner a accept 

} 

Ce serveur clone un fils avec fork pour chaque requete entrante. De cette maniere, il 
peut s'occuper de plusieurs requetes a la fois, tant que vous pouvez creer d'autres pro- 
cessus. (II se pourrait que vous vouliez fixer une limite a ceci.) Meme si vous ne faites 
pas de fork, le listen permettra d'avoir jusqu'a SOMAXCONN (generalement cinq ou plus) 
connexions en attente. Chaque connexion utilise des ressources, toutefois moins qu'un 
processus. Les serveurs faisant des fork doivent prendre soin de nettoyer une fois que 
leurs fils (appeles des zombies dans le jargon d'Unix) ont termine sinon il rempliraient 
vite votre table de processus. Le code FOSSOYEUR, presente au paragraphe « Signaux » 
s'en occupera pour vous ou vous pouvez affecter $SIG{CHLD} = ' IGNORE '. 

Avant de lancer une autre commande, nous connectons l'entree et la sortie (et la sortie 
d'erreurs) standard a la connexion du client. De cette maniere, toute commande lisant 
depuis STDIN et ecrivant vers STDOUT peut egalement parler a la machine distante. Sans 
la reaffectation, la commande ne pourrait pas trouver le handle du client — qui, par de- 
faut, est de toute facon ferme apres l'exec. 

Lorsque vous ecrivez un serveur en reseau, nous vous encourageons fortement a activer 
la verification du marquage par -T meme si vous ne toumez pas sous setuid ou setgid. 
C'est toujours une bonne idee pour les serveurs et tout autre programme qui est lance 
pour le compte de quelqu'un d'autre (comme tous les scripts CGI) car cela reduit les 
chances que des etrangers soient capables de compromettre votre systeme. Voir la sec- 
tion Gerer des donnees non sures au chapitre 23, Securite, pour plus d'informations a ce 
sujet. 

Une autre chose a prendre en consideration lors de l'ecriture de programme Internet : 
plusieurs protocoles specifient que la fin de ligne devrait etre CRLF, ce qui peut se speci- 
fier de differentes facons : "\015\012" ou "\xd\xa" ou meme chr(i3) .chr(io). Depuis 
la version 5.6 de Perl, ecrire vl3 . 10 produit egalement la meme chaine. (Sur plusieurs 
machines, vous pouvez egalement employer "\r\n" pour signifier CRLF mais ne le faites 
pas si vous voulez etre portable vers les Mac car la signification de \r et de \n est 
inversee !) Plusieurs programmes Internet accepte en fait un simple "\012" comme fin 
de ligne mais c'est parce que les programmes Internet essaient en general d'etre tole- 
rants dans ce qu'ils acceptent et rigides dans ce qu'ils emettent. (Si seulement nous arri- 
vions a pousser les gens a agir de la sorte...) 
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Passage de message 

Comme nous Taverns evoque auparavant, les communications UDP impliquent une sur- 
charge bien moindre mais ne fournisse aucune fiabilite, puisqu'il n'y a aucune promes- 
ses que les messages arriveront dans Fordre — ou meme qu'il arriveront tout court. On 
dit souvent qu'UDP signifie Unreliable Datagram Protocol (protocole de datagrammes 
non fiable). 

Neanmoins, UDP apporte des avantages par rapport a TCP, y compris la capacite de faire 
de la diffusion large (broadcast) ou multiple (multicast) a un ensemble complet d'hotes 
destinataires en une seule fois (generalement utilisee sur votre sous-reseau local). Si 
vous vous trouvez excessivement soucieux a propos de la fiabilite et que vous commen- 
cez a construire des verifications dans votre systeme de messages, vous devriez probable- 
ment commencer par utiliser TCP II est vrai qu'il est plus couteux de mettre en place et 
de se separer d'une connexion TCP mais si vous pouvez amortir cela sur plusieurs mes- 
sages (ou un message tres long), cela importe peu. 

De toute facon, voici un exemple d'un programme UDP II contacte le port UDP time 
des machines passees comme parametres dans la ligne de commande ou toutes les per- 
sonnes qu'il peut trouver en utilisant l'adresse universelle de broadcast si aucun argu- 
ment n'a ete donne. 13 Toutes les machines n'ont pas de serveur d'horloge active mais 
celles pour qui e'est le cas vous renverront un entier de 4 octets, empaquete dans Fordre 
« reseau », representant le nombre de secondes depuis 1900. Vous devez soustraire le 
nombre de secondes entre 1900 et 1970 pour fournir cette date au fonctions de conver- 
sion localtime ou gmtime. 

#!/usr/bin/perl 

# retardhorloge - compare les horloges cFautres systemes avec celle-ci 

# sans arguments, broadcast a quiconque est a l'ecoute. 

# attend une reponse pendant une demi-seconde. 

use V5.6.0; # or une version superieure 
use warnings; 
use strict; 
use Socket; 

unshift(@ARGV, inet_ntoa (INADDR_BR0ADCAST) ) 
unless @ARGV; 

socket(my $sock_mess, PFINET, SOCKJIGRAM, getprotobyname("udp")) 
or die "socket : $!"; 

# Certains machines ont besoin de ceci. Ca ne devrait pas faire de 

# mal aux autres. 

setsockopt($sock_mess, S0LS0CKET, S0_BR0ADCAST, l) 
or die "setsockopt : $!"; 



13. Si cela ne fonctionne pas, lancez ifconf ig -a pour trouve l'adresse de broadcast locale appro- 
priee. 
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my $no_port = getservbyname("time" , "udp") 
or die "pas de port udp time"; 

for my $cible (@ARGV) { 

print "Envoi a $cible:$no_port\n"; 

my $adr_dest_p = sockaddr_in($no_port, inet_aton($cible)); 
send($sock_mess, "x", 0, $adr_dest_p) 
or die "send : $!"; 



# le service d'horloge renvoie une heure sur 32 bits en secondes 

# depuis 1900 

my $DEPUIS_1900_A_0RIGINE = 2208988800; 
my $fmt_heure = "N"; # et ceci en format binaire 
my $lg_heure = length(pack($fmt_heure, l)); # n'importe quel nombre 

# convient 

my $masque_entree = "; # chaine pour stocker les bits de fileno bits 

# pour le select 
vec($masque_entree, f ileno($sock_mess) , l) = 1; 

# n J attend une entree qu'une demi-seconde 

while (select(my $masque_sortie = $masque_entree, undef, undef, 0.5)) { 
defined(my $adr_src_p = recv($sock_mess, my $heure_bin, $lg_heure, 0)) 

or die "recv : $!"; 
my($portj $adr_ip) = sockaddr_in($adr_src_p); 
my $hote_emet = sprintf "%s [%s]", 

gethostbyaddr($adr_ip, AF_INET) || 'UNKNOWN', 
inet_ntoa($adr_ip); 
my $delta = unpack($fmt_heure, $heure_bin) - 

$DEPUIS_1900_A_0RIGINE - timeQ; 
print "L'horloge sur $hote_emet est en avance de $delta 
secondes sur celle-ci.\n"; 

} 
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La programmation parallele est beaucoup plus compliquee qu'elle ne semble l'etre. 
Imaginez que vous preniez une recette dans un livre de cuisine et que vous la convertis- 
siez en quelque chose sur lequel plusieurs douzaines de chefs cuisiniers pourraient tra- 
vailler en meme temps. Vous pouvez adopter deux approches. 

La premiere consiste a donner a chaque chef sa cuisine privee, completement equipee 
avec son propre materiel et ses propres ustensiles. Pour les recettes qui peuvent etre fa- 
cilement decomposers et pour les aliments qui peuvent etre transportes d'une cuisine 
a une autre, cette approche fonctionne bien car elle empeche chaque chef d'empieter 
sur la cuisine de son voisin. 

Sinon, il vous suffit de mettre tous les chefs dans une seule cuisine et de les laisser se 
debrouiller en decidant qui utilise le mixer et quand. Cela peut se transformer en pa- 
gaille, surtout lorsque les couteaux de boucher commencent a voler. 

Ces deux approches correspondent a deux modeles de programmation parallele sur les 
ordinateurs. Le premier est le modele multiprocessus, typique des systemes Unix tradi- 
tionnels, dans lequel chaque thread 1 de controle possede son propre jeu de ressources. 
Le second modele est le modele multithread, dans lequel chaque thread de controle par- 
tage des ressources avec tous les autres threads de controle. Ou ne les partage pas, com- 
me cela peut parfois arriver (et comme cela doit parfois arriver). 

Nous savons tous que les chefs aiment prendre le controle ; ca ne pose pas de probleme 
car les chefs out besoin de prendre le controle pour accomplir ce que nous voulons qu'ils 
accomplissent. Mais les chefs doivent s'organiser, d'une maniere ou d'une autre. 

Perl implemente les deux modeles d'organisation. Dans ce chapitre nous les appellerons 
le modele de processus et le modele de thread. 



1. N.d.T. : La traduction francaise d'un thread est « une tache legere » ou une unite elementaire 
de processus, mais comme le terme est generalement connu de tous les programmeurs et que les 
programmeurs Perl sont particulierement impatients, paresseux et orgueilleux, nous emploie- 
rons litteralement le mot thread dans cet ouvrage, ce qui nous permet d'aller plus vite, d'en ecrire 
moins et d'en etre particulierement fiers ! 
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Le modele de processus 

Nous ne nous etendrons pas trop sur le modele de processus ici, simplement parce qu'il 
est dominant tout au long du reste de ce livre. Perl est issu des systemes Unix, il a done 
adopte la notion que chaque processus accomplit son propre travail. Si un processus 
veut demarrer un traitement parallele, il doit logiquement demarrer un processus 
parallele ; e'est-a-dire qu'il doit faire un fork pour avoir un nouveau processus poids 
lourd, qui ne partage par defaut que tres peu de choses avec son processus pere, si ce n'est 
certains descripteurs de fichiers. (Le pere et le fils peuvent sembler partager beaucoup 
plus, mais une grande partie de l'etat du processus pere est dupliquee dans le processus 
fils que reellement partagee au sens logique du terme. Le systeme d'exploitation peut 
bien entendu faire preuve de paresse quand il s'agit de forcer cette separation logique, 
auquel cas nous appelons cela une semantique de copie lors d'ecritures (copy-on-write) 
mais nous ne ferions pas de copie du tout, s'il n'y avait pas en premier lieu de separation 
logique.) 

Historiquement, cette vision industrielle du traitement multiprocessus a pose de petits 
problemes sur les systemes Microsoft car Windows n'avait pas de modele multiprocessus 
bien developpe (et il ne se reposait pas souvent sur ce qu'il avait a cet egard pour la pro- 
grammation parallele). II a typiquement adopte a la place une approche multithread. 

Toutefois, au prix d'effbrts heroiques, la version 5.6 de Perl implemente maintenant 
l'operation fork sur Windows en clonant un nouvel objet interpreteur a l'interieur du 
meme processus. Cela signifie que la plupart des exemples utilisant fork dans le reste 
de ce livre fonctionneront maintenant sur Windows. L'interpreteur clone partage du 
code immuable avec les autres interpreteurs mais recoit sa propre copie des donnees 
avec lesquelles il s'amusera. (Bien entendu, il peut toujours y avoir des problemes avec 
les bibliotheques C qui ne comprennent pas les threads.) 

Cette approche du traitement multiprocessus a ete baptisee ithreads, comme raccourci 
pour « threads d'interpreteurs ». L'emulation de fork pour les systemes Microsoft a de- 
clenche l'implementation des ithreads. Toutefois, nous avons rapidement realise que, 
bien les autres interpreteurs tournaient sous des threads distincts, ils tournaient dans le 
meme processus, il serait done facile de faire partager des donnees a ces interpreteurs 
separes, meme s'ils ne les partageaient pas par defaut. 

C'est exactement l'inverse du modele multithread typique, dans lequel tout est partage 
par defaut et oil vous devez vous echiner a ne pas partager quelque chose. Mais vous ne 
devriez pas voir ces deux modeles comme etant completement distincts Fun de l'autre 
car ils essaient tous deux de construire un pont au-dessus de la meme riviere ; ils ne font 
que le construire sur des berges opposees. La veritable solution a tout probleme de trai- 
tement parallele est de meler un certain degre de partage dans un certain degre d'ego- 
i'sme. 

Ainsi, le but a long terme est d'etendre le modele d'ithreads pour permettre autant de 
partage que vous avez besoin ou que vous voulez. Toutefois, a l'heure oil nous ecrivons 
ces lignes, la seule interface pour les ithreads visible par l'utilisateur est l'appel fork sous 
les portages Microsoft de Perl. Nous pensons que cette approche produira eventuelle- 
ment des programmes plus propres que l'approche multithread standard. A la base, il 
est plus facile de gerer une economie oil vous presumez que chacun possede ce qu'il a, 
plutot que de presumer que tout le monde possede tout. Ce n'est pas que Ton attend des 
gens qu'ils ne partagent pas dans une economie capitaliste, ou qu'ils ne detournent pas 
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de fonds publics 2 dans une economie communiste. Ces choses tendent a s'equilibrer. II 
arrive que Ton soit dans une economie socialiste. Mais avec d'inportant groupes de per- 
sonnes, le partage de tout par defaut ne fonctionne que si vous avez un « chef en chef » 
avec un grand couteau de boucher, pensant que tout lui appartient. 

Bien entendu, le veritable gouvernement de tout ordinateur est gere par un dictateur 
fasciste connu sous le nom de systeme d'exploitation. Mais un dictateur avise sait lors- 
qu'il faut faire croire aux gens qu'ils sont capitalistes — et lorsqu'il faut leur faire croire 
qu'ils sont communistes. 

Le modele de thread 

Le modele de thread pour le traitement parallele a tout d'abord ete introduit dans Perl 
comme une fonctionnalite experimentale dans la version 5.005. (Nous voulons dire par 
« modele de thread », des threads partageant des ressources de donnee par defaut, non 
les nouveaux ithreads de la version 5.6.) Par certains cotes, ce modele de thread est tou- 
jours une fonctionnalite experimentale meme en 5.6 car Perl est un langage riche et le 
traitement multithread peut mettre un fouillis meme dans le plus simple des langages. 
II existe toujours des coins et recoins de la semantique de Perl qui n'interagissent pas tres 
bien avec la notion que tout soit partage. Le nouveau modele des ithreads est une ten- 
tative pour contourner ces problemes et, a un moment a l'avenir, il se peut que le mo- 
dele de thread actuel soit englobe dans le modele d'ithread (lorsque nous aurons une 
interface aux ithreads qui dira « partagez tout ce que vous pouvez par defaut »). Mais 
malgre ses problemes, Factuel modele de thread « experimental » continue d'etre tres 
utile dans plusieurs situations du mode reel oil il est preferable d'etre un cobaye plutot 
que de ne pas avoir de threads. Des applications raisonnablement robustes peuvent etre 
ecrites en Perl avec des threads mais vous devez faire tres attention. Vous devriez au 
moins envisager d'utiliser plutot fork, si vous pouvez trouver un moyen de resoudre vo- 
tre probleme avec des pipes a la place de structures de donnees partagees. 

Mais certains algorithmes sont plus simples a exprimer si de multiples taches peuvent 
acceder facilement et efficacement au meme jeu de donnees. 3 Cela produit du code plus 
petit et plus simple. Et puisque le noyau n'a pas a copier des tableaux de pages pour les 
donnees (meme s'il fait de la copie lors d'ecriture {copy-on-write)) lors de la creation de 
thread, il devrait etre plus rapide de demarrer une tache de cette maniere. De meme, le 
changement de contexte peut etre plus rapide si le noyau n'a pas besoin d'echanger 
(swap) des tableaux de pages. (En fait, pour les threads au niveau de l'utilisateur, le 
noyau n'est pas implique du tout — bien que les threads au niveau de l'utilisateur aient 
bien entendu des problemes que les threads du noyau n'ont pas.) 

Voici pour les bonnes nouvelles. Maintenant, passons a d'autres plus sujettes a reclama- 
tions. Nous avons deja mentionne que le traitement des threads etait quelque peu expe- 
rimental en Perl mais, meme s'il ne l'etait pas, la programmation avec des threads est 



2. Detourner des fonds publics : piquer la propriete publique dans les fonds au milieu de la 
nuit ; detourner du public quelque chose qui n'est pas forcement de Fargent, cf. adopter, etendre, 
GPL. 

3. Le modele de memoire partagee des IPC System V, dont nous avons parle dans le chapitre 
precedent, ne peut pas etre qualifie exactement comme etant « facile et efficace ». 
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assez traitre. La capacite d'un flux d'execution a placer, qu'on le veuille ou non, des trous 
dans l'espace des donnees d'un autre, est susceptible de provoquer des desastres, plus 
que vous ne pouvez l'imaginer. Vous pourriez vous dire : « C'est facile a corriger, je n'ai 
qu'a mettre des verrous sur les donnees partagees. » D'accord, le verrouillage des don- 
nees partagees est indispensable mais disposer de protocoles de verrouillages qui soient 
corrects est une difficulte de notoriete publique, avec des erreurs generant des verrous 
mortels (deadlocks) ou des resultats non deterministes. Si vous avez des problemes de 
synchronisation dans votre programme, Femploi de threads va non seulement les aggra- 
ver mais les rendra egalement plus difficiles a localiser. 

Vous etes non seulement responsable de l'honnetete de vos propres donnees partagees, 
mais egalement de celle des modules Perl et des bibliotheques C que vous appelez. Vo- 
tre code Perl a beau etre securise au niveau des threads a 100 %, si vous appelez un mo- 
dule ou un sous-programme C qui ne soit pas sur au niveau des threads, vous etes grille. 
Vous devriez presumer qu'aucun module n'est sur au niveau des threads a moins de le 
prouver. Ceci inclut meme certains des modules standard. Peut-etre meme la plupart 
d'entre eux. 

Nous ne vous avons pas deja decourage ? Non ? Alors nous mettrons Faccent sur le fait 
que vous etes quelque peu a la merci des bibliotheques de votre systemes d'exploitation 
pour le traitement des threads lorsqu'il s'agit de politiques d'ordonnancement et de 
preemption. Certaines bibliotheques de thread ne font du basculement de thread que 
sur les appels systeme bloquants. Certaines bloquent le processus entier si un seul 
thread fait un appel systeme bloquant. Certaines ne basculent les threads que sur l'expi- 
ration d'un delai quantifiable (soit d'un thread, soit d'un processus). Certaines ne bas- 
culent les threads qu'explicitement. 

Oh, et pendant qu'on y est, si votre processus recoit un signal, determiner a quel thread 
ce signal est delivre est completement dependant du systeme. 

Pour faire de la programmation de thread en Perl, vous devez compilez une version spe- 
ciale de Perl en suivant les instructions fournies dans le fichier README.threads dans le 
repertoire des sources de Perl. II est a peu pres garanti que ce Perl speciale tournera 
moins vite que votre executable Perl standard. 

Ne presupposez pas que, puisque vous savez comment les threads sont programmes 
dans d'autres modeles (POSIX, DEC, Microsoft, etc.), vous savez comment les threads 
fonctionnent en Perl. Comme avec d'autres choses en Perl, Perl est du Perl, non du C++ 
ou du Java ou quoi que ce soit d'autre. Par exemple, il n'y a pas de priorites de thread en 
temps reel (et aucun moyen de contourner leur absence). II n'y a pas non plus de ver- 
rous d'exclusion mutuelle (mutex). Utilisez simplement le verrouillage ordinaire ou 
peut-etre le module Thread: Semaphore ou les mecanismes de cond_wait. 

Toujours pas decourage ? Bien ! Car les threads sont vraiment sympas. Vous pouvez pre- 
voir de vous amuser. 

Le module Thread 

L'interface actuelle pour les threads en Perl est definie par le module Thread. De plus, 
un nouveau mot-cle de Perl a ete ajoute, l'operateur lock. Nous parlerons de lock ulte- 
rieurement dans ce chapitre. Les autres modules standard de thread sont construits a 
partir de cette interface de base. 
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Le module Thread fournit ces methodes de classe : 



Methode 


Utilisation 


new 


Construit un nouvel objet Thread. 


self 


Renvoie mon objet Thread courant. 


list 


Renvoie la liste des objets Thread. 


Et pour les objets Thread, il fournit ces methodes d'objet : 


Methode 


Utilisation 


join 


Moissonne un thread (propage les erreurs). 


eval 


Moissonne un thread (capture les erreurs). 


equal 


Compare l'identite de deux threads. 


tid 


Renvoie l'ID de thread interne. 



De plus, le module Thread fournit ces fonctions que Ton peut importer : 



Fonction 


Utilisation 


yield 


Dit a l'ordonnanceur de lancer un thread different. 


async 


Construit un nouveau thread via une fermeture. 


cond_signal 


Reveille exactement un thread qui fait un condwaitQ sur une 
variable. 


cond broadcast 


Reveille tous les threads qui font un cond waitQ sur une variable. 


cond wait 


Attend sur une variable jusqua etre reveille par un 
cond_signCal() ou un condbroadcastQ sur cette variable. 



Creation de thread 

Vous pouvez engendrer un thread de deux manieres, soit en utilisant la methode de 
classe Thread->new, soit en utilisant la fonction async. Dans tous les cas, la valeur ren- 
voyee est un objet Thread. Thread- >new prend une reference de code indiquant la fonc- 
tion a lancer et des arguments a passe a cette fonction : 

use Thread; 

$t = Thread->new(\&fonc, $argl, $arg2); 

Vous vous retrouvez souvent a vouloir passer une fermeture comme premier argument 
sans fournir d'arguments supplementaires : 

my $quelque_chose; 

$t = Thread->new( sub { dit($quelque_chose) } ); 

Dans ce cas special, la fonction async donne un relief dans Fecriture (c'est-a-dire du Su- 
cre de syntaxe) : 

use Thread qw(async); 
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my 
$t 



$quelque_chose; 
= async { 
dit($quelque_chose); 



}; 



Vous remarquerez que nous avons importe explicitement la fonction async. Bien enten- 
du, vous pouvez egalement utiliser le nom pleinement qualifie Thread : : async a la pla- 
ce, mais alors votre sucre de syntaxe n'est plus aussi doux. Puisqu'async ne prend qu'une 
fermeture, tout ce que vous voulez lui passer doit etre une variable lexicale qui soit a ce 
moment dans la portee. 

Destruction de thread 

Une fois commence — et sujet aux lubies de votre bibliotheque de thread — le thread 
continuera a tourner tout seul jusqu'a ce que sa fonction de plus haut niveau (celle que 
vous avez passee au constructeur) renvoie un resultat. Si vous voulez terminer un 
thread plus tot, il vous suffit de faire return depuis l'interieur de cette fonction de plus 
haut niveau. 4 

Maintenant, tout est parfait pour que votre thread se termine en renvoyant un resultat, 
mais a qui le renvoyer ? Le thread qui a engendre ce thread-ci est vraisemblablement 
parti faire d'autres choses et n'attend plus de reponse a Fappel de la methode. La repon- 
se est assez simple : le thread attend jusqu'a ce que quelqu'un emette un appel de me- 
thode qui fasse l'attente d'une valeur de retour. Cet appel de methode s'appelle join 
(joindre) car il fait se rejoindre de maniere conceptuelle deux threads en un seul : 

$val_ret = $t->join(); # moissonne le thread $t 

L'operation join est une reminiscence de waitpid sur un processus fils. Si le thread a 
deja termine, la methode join rend la main immediatement avec la valeur valeur ren- 
voyee par la fonction principale du thread. Si le thread n'a pas fini, join se comporte 
comme un appel bloquant qui interrompt le thread appelant indefiniment. (II n'y a pas 
de mecanisme de minuterie (time-out).) Lorsqu'eventuellement le thread s'acheve, le 
join renvoie une valeur. 

Toutefois, au contraire de waitpid, qui ne peut moissonner que les propres fils d'un pro- 
cessus, n'importe quel thread peut faire un join sur n'importe quel autre thread a fin- 
terieur du processus. C'est-a-dire qu'il n'est pas necessaire que le thread qui fait le join 
soit le thread principal ou le thread parent. La seule restriction est qu'un thread ne peut 
pas faire de join sur lui-meme (ce qui reviendrait a officier pour vos propres funerailles) 
et qu'un thread ne peut pas faire de join sur un thread qui a deja repondu a un join 
(ce qui equivaudrait a deux directeurs des pompes funebres se battant au-dessus de la 
depouille). Si vous essayez de faire l'une de ces choses, une exception sera levee. 

La valeur de retour de join ne doit pas forcement etre une valeur scalaire — elle peut 
egalement etre une liste : 



4. N'appelez pas exit ! Cela essayerait de quitter votre processus entier et y arriverait peut-etre. 
Mais en fait, le processus ne se terminera pas avant que tous les threads ne le fassent et certains 
d'entre eux peuvent refuser de se terminer sur un exit. Nous donnerons plus d'informations la- 
dessus plus tard. 
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use Thread 'async'; 

$tl = async { 

my @trucs = getpwuid($>); 
return @trucs; 

}; 

$t2 = async { 

my $mess = 'cat /etc/motd'; 
return $mess; 

}; 

@liste_ret = $tl->join(); 
$val_ret = $t2->join(); 

print "Le ler fils a renvoye @liste_ret\n"; 
print "Le 2eme fils a renvoye $val_ret\n"; 

En fait, l'expression renvoyee par un thread est toujours evaluee dans un contexte de lis- 
te, meme si join est appele dans un contexte scalaire, auquel cas la derniere valeur de 
la liste est renvoyee. 

Capture des exceptions avecjoin 

Si un thread se termine avec une exception non capturee, cela ne tuera pas immediate- 
ment le programme entier. Cela serait embetant. A la place, lorsqu'un join est lance sur 
ce thread, le join leve lui-meme l'exception. L'emploi de join sur un thread indique une 
volonte de propager toute exception levee par ce thread. Si vous preferez capturer l'ex- 
ception a ce moment et a cet endroit, utilisez la methode eval, qui comme la fonction 
interne du meme nom, fait que l'exception est mise dans $@ : 

$val_ret = $t->eval(); # capture les erreurs lorsque les 

# threads se rejoignent 

if m { 

warn "echec du thread : $@"; 

} 

else { 

print "le thread a renvoye $ret_val\n"; 

} 

Bien qu'il n'y ait pas de regie a cet effet, vous pourriez vouloir adopter l'habitude de ne 
rejoindre un thread que depuis le thread qui a cree celui que vous rejoignez. C'est-a-dire 
que vous ne moissonnez un thread fils que depuis le thread pere qui l'a engendre. Cela 
rend plus facile la conservation d'une trace indiquant quelles exceptions vous auriez be- 
som de capturer et quand le faire. 

La methode detach 

Comme autre solution pour arreter les threads, si vous n'avez pas prevu de rejoindre un 
thread plus tard avec join pour obtenir sa valeur de retour, vous pouvez appeler la me- 
thode detach sur ce thread pour que Perl le nettoie a votre place. C'est un peu comme 
lorsqu'un processus est herite par le programme init sur Unix, sauf que le seul moyen 



424 



Chapitre 17 — Threads 



de faire cela sur Unix est que le processus pere meure. 

La methode detach ne met pas le thread « en arriere plan » ; si vous essayez de sortir du 
programme principal et qu'un thread detache est toujours en train de tourner, la fin du 
programme bloquera jusqu'a ce que le thread lui-meme se termine. Mais plutot, la me- 
thode detach vous epargne les taches de nettoyage. Elle indique purement et simple- 
ment a Perl de ne pas garder la valeur de retour, ni la valeur de sortie du thread apres 
qu'il a fini. En un sens, detach dit a Perl de faire un join implicite lorsque le thread finit 
puis de jeter les resultats. Cela peut avoir de l'importance : si vous n'avez jamais fait de 
join, ni de detach, sur un thread qui renvoie une liste tres grande, cet espace de stocka- 
ge sera perdu jusqu'a la fin. En effet, Perl devrait s'agripper a lui dans la perspective loin- 
taine (mais alors tres lointaine, dans ce cas), oil quelqu'un voudrait faire un join sur ce 
thread a un moment a Favenir. 

Une exception levee dans un thread fils detache ne se propage plus non plus durant un 
join, puisque les threads ne s'uniront jamais. Utilisez sagement eval {} dans la fonc- 
tion de plus haut niveau et trouvez d'autres moyens de rapporter les erreurs. 

Identification des threads 

Chaque thread de Perl possede un numero d'identification de thread distinct, qui est 
celui que la methode tid renvoie : 

$son_num_tid = $tl->tid(); 

Un thread peut acceder a son propre objet thread par l'intermediaire de Fappel Thread - 
>self. Ne confondez pas cela avec l'ID du thread : pour calculer son propre ID, un 
thread fait ceci : 

$mon_tid = Thread->self->tid() ; # $$ pour les threads, pour ainsi dire 

Pour comparer un objet thread avec un autre, employez Tune de ces techniques : 

Thread: :equal($tl, $t2) 
$tl->equal($t2) 
$tl->tid() == $t2->tid() 

Liste des threads courants 

Vous pouvez obtenir une liste des objets threads courants dans le processus courant en 
utilisant l'appel de methode de classe Thread- >list. La liste comprend a la fois les 
threads en train de tourner et ceux qui ont fini mais sur lesquels aucun join n'a encore 
ete applique. Vous pouvez faire ceci depuis n'importe quel thread. 

for my $t (Thread->list()) { 

printf "$t a un tid = %d\n", $t->tid(); 

} 

Priorite au processeur 

Le module Thread implemente une fonction, que vous pouvez importer, appelee 
yield. Elle fait en sorte que le thread appelant abandonne le processeur. Malheureuse- 
ment, les details de ce mecanisme sont completement dependants votre version d'im- 
plementation des threads. Neanmoins, abandonner le controle de la CPU 
occasionnellement est consideree comme un geste d'amabilite : 
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use Thread 'yield'; 
yield(); 

L'utilisation des parentheses n'est pas une obligation. C'est meme encore plus sur, syn- 
taxiquement parlant, car la faute de frappe apparemment inevitable « yeild » est alors 
interceptee : 

use strict; 

use Thread 'yield'; 

yeild; # Le compilateur se desole, puis arrete tout 

yield; # Ok. 

Acces au donnees 

Ce que nous savons passe en revue jusqu'ici n'etait pas bien complique; mais nous som- 
mes sur le point d'y remedier. Rien de ce que nous avons fait ne mettait en pratique la 
nature parallele des threads. L'acces aux donnees partagees change tout cela. 

Le code mis dans un thread en Perl possede les memes limites en ce qui concerne la vi- 
sibility des donnees que tout autre morceau de code en Perl. On a toujours acces aux 
variables globales via des tables de symboles globales et aux variables lexicales via une 
portee lexicale (memoire de travail, scratchpad). 

Toutefois, le fait que de multiples threads de controle existent dans le programme gene- 
re des erreurs dans les travaux. Deux threads ne peuvent etre autorises a acceder a la 
meme variable globale simultanement ou ils peuvent s'ecraser l'un Fautre. (Le resultat 
de Fecrasement depend de la nature de Faeces.) De meme, deux threads ne peuvent etre 
autorises a acceder a la meme variable lexicale simultanement car les variables lexicales 
se comportent egalement comme les globales si elles sont declarees en dehors de la por- 
tee de fermetures utilisees par des threads. Demarrer des threads via des references de 
sous-programmes (en utilisant Thread- >new) plutot que via des fermetures (en utilisant 
a sync) peut aider a limiter l'acces aux variables lexicales, si c'est ce que vous voulez. (Par- 
fois ce n'est cependant pas le cas.) 

Perl resout le probleme pour certaines variables speciales internes, comme $!,$_, @_ et 
les autres variables comme celles-ci, en en faisant des donnees specifiques au thread. La 
mauvaise nouvelle est que toutes vos variables de paquetage, basiques, que vous utilisez 
quotidiennement, ne sont pas protegees des ecrasements. 

La bonne nouvelle est que vous n'avez generalement pas a vous inquieter a propos de 
vos variables lexicales, en supposant qu'elles soient declarees a Finterieur du thread cou- 
rant, puisque chaque thread instanciera l'entree de sa propre portee lexicale, qui est dis- 
tincte de celle de tout autre thread. Vous ne devez vous soucier des variables lexicales 
que si elles sont partagees entre les threads, par exemple en passant des references ou en 
referencant les variables lexicales a Finterieur de fermetures utilisees par de multiples 
threads. 

Synchronisation des acces avec lock 

Lorsque plusieurs agents peuvent acceder au meme element en meme temps, des colli- 
sions surviennent, exactement comme a un carrefour. Le verrouillage du carrefour est 
votre seule defense. 
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La fonction interne lock est le mecanisme de Perl correspondant a un feu tricolore pour 
le controle des acces. Bien que lock soit en quelque sorte un mot-cle, c'est un mot-cle 
timide car la fonction interne n'estpas utilisee si le compilateur a deja vu un definition 
sub lock {} dans le code de l'utilisateur. Ceci est destine a assurer une compatibility 
anterieure. Cependant, CORE : : lock designe toujours la fonction interne. (Dans un perl 
qui n'a pas ete compile pour le traitement des threads, l'appel de lock n'est pas une er- 
reur ; c'est une operation sans danger ne faisant rien (no-op), du moins dans les versions 
recentes.) 

Exactement de la mime maniere que l'operateur flock ne bloque que d'autres instan- 
ces de flock, et non les veritables entrees/sorties, l'operateur lock egalement, ne bloque 
que d'autres instances de lock, et non les acces ordinaires aux donnees. Ce sont, en effet, 
des verrous consultatifs. Exactement comme les feux tricolores. 5 

Vous pouvez faire un lock sur des variables scalaires individuelles aussi bien que sur des 
tableaux ou des hachages entiers. 

lock $var; 
lock (Svaleurs; 
lock %hachage; 

Cependant, l'emploi de lock sur des valeurs agregees ne verrouille pas implicitement 
les composants scalaires de ces valeurs agregees : 

lock @valeurs; # dans le thread 1 

lock $valeurs[23] ; # dans le thread 2 --- ne verrouille pas ! 

Si vous verrouillez un reference, cela verrouille automatiquement Faeces au referant. 
C'est-a-dire que vous obtenez gratuitement une dereference. Ceci est bien commode car 
les objets sont toujours caches derriere un reference et vous voulez souvent verrouiller 
des objets. (Et vous ne voulez presque jamais verrouiller des references.) 

Le probleme avec les feux tricolores, bien entendu, est qu'ils sont rouge la plupart du 
temps et que vous devez attendre. De meme, lock est un appel bloquant — votre thread 
sera suspendu a cet endroit jusqu'a ce que le verrou soit accorde. II n'y a pas de mecanis- 
me de minuterie (time-out). II n'y a pas non plus de mecanisme de deverrouillage car les 
verrous ont une portee dynamique. lis durent jusqu'a ce que leur bloc, leur fichier ou 
leur eval soit fini. Lorsqu'ils sortent de la portee, il sont automatiquement liberes. 

Les verrous sont egalement recursifs. Cela signifie que si vous verrouillez une variable 
dans une fonction et que cette fonction s'appelle recursivement pendant que vous dete- 
nez le verrou, le meme thread pourra verrouiller avec succes la meme variable a nou- 
veau. Le verrou est finalement abandonne lorsque l'on est sorti de tous les niveaux 
detenant les verrous. 

Voici une demonstration simple de ce qui peut se passer si vous n'avez pas verrouille. 
Nous forcons un changement de contexte en utilisant yield pour montrer le genre de 



5. Certains feux de passage a niveau sont obligatoires (ceux avec une barriere) et certaines per- 
sonnes pensent que les verrous devraient l'etre egalement. Mais imaginez seulement un monde 
dans lequel chaque carrefour aurait des armes se levant et se baissant lorsque les feux change- 
raient. 
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probleme qui peut egalement arriver accidentellement avec un ordonnanceur preemptif : 

use Thread qw/async yield/; 
my $var = 0; 
sub une_inf lation { 
if ($var == 0) { 
yield; 
$var++; 

} 

} 

my $tl = new Thread \&une_inflation; 
my $t2 = new Thread \&une_inflation; 

for my $t ($tl, $t2) { $t->join } 
print "var vaut $var\n"; 

Ce code affiche toujours 2 (pour une certaine definition de « toujours ») car nous avons 
decide de l'inflation apres avoir vu que la variable valait 0 mais avant que nous puis- 
sions le faire, un autre thread a decide d'en faire autant. 

Nous pouvons resoudre cette collision par Fajout trivial d'un verrou avant d'examiner 
$var. Maintenant ce code affiche toujours 1 : 

sub une_inflation { 
lock $var; 
if ($var == 0) { 
yield; 
$var++; 

} 

} 

Souvenez-vous qu'il n'y a pas de fonction unlock explicite. Pour controler le dever- 
rouillage, vous n'avez qu'a ajouter un autre niveau de portee, qui soit imbrique, pour 
que le verrou soit relache lorsque cette portee se termine : 

sub une_inflation { 
{ 

lock $var; 

if ($var == 0) { 

yield; 

$var++; 

} 

} # le verrou est relache ici ! 

# autre code avec $var deverrouillee 

} 

Verrous mortels (deadlocks) 

Le verrou mortel (deadlock) est le f leau des programmeurs de threads car il est facile d'en 
creer par accident et difficile de l'eviter. Voici un exemple simple de verrou mortel : 

my $tl = async { 

lock $a; yield; lock $b; 
$a++; $b++ 
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my $t2 = async { 

lock $b; yield; lock $a; 
$b++; $a++ 

}; 

La solution ici est que tous les protagonistes qui on besoin d'un ensemble de verrous 
particulier s'en saisissent dans le meme ordre. 

C'est egalement une bonne chose de minimiser la duree pendant laquelle vous detenez 
des verrous. (Au moins, c'est une bonne chose de le faire pour des questions de perfor- 
mance. Mais si vous le faites pour reduire les risques de verrou mortel, tout ce que vous 
faites est de le rendre plus difficile a reproduire et a diagnostiquer le probleme.) 

Verrouillage des sous-programmes 

Vous pouvez egalement mettre un verrou sur un sous-programme : 
lock Sfonc; 

Au contraire des verrous sur les donnees, qui ne sont que consultatifs, les verrous de 
sous-programmes sont obligatoires. Personne d'autre que le thread detenant le verrou 
peut entrer dans le sous-programme. 

Considerez le code suivant, qui contient des situations de concurrence (race conditions) 
impliquant la variable $f ini. (Les yield ne sont mis qu'a titre de demonstration.) 

use Thread qw/async yield/; 
my $fini = 0; 
sub bricole { 

my $arg = shift; 

my $tid = Thread->self->tid; 

print "thread $tid : bricole $arg\n"; 

yield; 

unless ($fini) { 
yield; 
$fini++; 

bricole($arg + 10); 

} 

} 

Si vous le lancez de cette facon : 
my @t; 

for my $i (l. .3) { 

push %t, Thread->new(\&bricole, $i); 

} 

for (@t) { $_->join } 
print "fini vaut $fini\n"; 

voici l'affichage (enfin, certaines fois — ce n'est pas deterministe) : 

thread 1 : bricole 1 

thread 2 : bricole 2 

thread 3 : bricole 3 

thread 1 : bricole 11 
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thread 2 : bricole 12 
thread 3 : bricole 13 
fini vaut 3 

Toutefois, si vous le lancez de cette facon : 

for my $i (1..3) { 
push @>t, async { 
lock Sbricole; 
bricole($i); 

}; 

} 

for (@t) { $_->join } 
print "fini vaut $fini\n"; 

voici l'affichage : 

thread 1 : bricole 1 
thread 1 : bricole 11 
thread 2 : bricole 2 
thread 3 : bricole 3 
fini vaut 1 

L'attribut locked 

Bien qu'il soit obligatoire d'obeir a un verrou de sous-programme, rien ne force person- 
ne a les verrouiller en premier lieu. Mais certains sous-programmes aimeraient vrai- 
ment etre capables d'exiger d'etre verrouilles avant d'etre appeles. 

L'attribut de sous-programme locked remplit cette fonction. II est plus rapide que l'ap- 
pel lock Sfonc car il est connu a la compilation, non seulement a l'execution. Mais le 
comportement est le mime que lorsque nous l'avons verrouille explicitement aupara- 
vant. Voici la syntaxe : 

sub bricole : locked { 

# comme avant 

} 

Si vous avez un prototype de fonction, il vient entre le nom et tous les attributs : 

sub bricole ($) : locked { 

# comme avant 

} 

Verrouillage des methodes 

Le verrouillage automatique d'un sous-programme est vraiment tres pratique mais il en 
fait parfois un peu trop. Lorsque vous invoquez une methode d'objet, cela n'a generale- 
ment aucune importance si de multiples methodes sont lancees simultanement pour 
autant qu'elles le sont toutes pour le compte d'objets differents. Vous aimeriez done 
vraiment verrouiller plutot Fobjet sur lequel cette methode est appelee. L'ajout d'un at- 
tribut method a la definition du sous-programme fait ceci : 

sub bricole : locked method { 

# comme avant 

} 
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Si ce code est appele en tant que methode, l'objet qui l'invoque est verrouille, fournis- 
sant un acces sequentiel a cet objet mais permettant a la methode d'etre appelee sur 
d'autres objets. Si la methode n'est pas appelee sur un objet, l'attribut essaie toujours de 
faire ce qu'il faut : si vous appelez une methode verrouillee comme une methode de 
classe (Paquetage->new plutot que $obj->new), la table de symboles du paquetage est 
verrouillee. Si vous appelez une methode verrouillee comme un sous-programme nor- 
mal, Perl levera une exception. 

Variables de condition 

Une variable de condition permet a un thread d'abandonner le processeur jusqu'a ce 
qu'un certain critere soit satisfait. Les variables de conditions indiquent des points de 
coordination entre les threads lorsque vous avez besoin de plus de controle que ce qu'un 
seul verrou fournit. D'un autre cote, vous n'avez pas vraiment besoin de plus de temps 
systeme (overhead) qu'un verrou ne fournit et les variables de condition sont concues 
dans cet esprit. Vous n'avez qu'a utiliser des verrous ordinaires plus des conditions ordi- 
naires. Si la condition echoue, vous devrez alors prendre des mesures extraordinaires via 
la fonction cond_wait ; mais nous optimisons pour les chances de reussite, puisque dans 
une application bien concue, nous ne devrions pas de toute facon nous trouver dans un 
goulot d'etranglement sur la condition courante. 

Outre le verrouillage et le test, les operation de base sur les variables de condition con- 
sistent a envoyer ou recevoir un evenement « signal » (non un signal reel au sens de 
%SIG). Soit, vous suspendez votre execution pour attendre la reception d'un evenement, 
soit vous envoyez un evenement pour reveiller d'autres threads attendant une condition 
particuliere. Le module Thread fournit trois fonctions, que vous pouvez importer, pour 
faire cela : cond_wait, cond_signal et cond_broadcast. Ce sont les mecanismes primai- 
res sur lesquels se basent des modules plus abstraits comme Thread : : Queue et 
Thread: Semaphore. II est souvent plus commode d'utiliser ces abstractions, lorsque 
c'est possible. 

La fonction cond_wait() prend une variable deja verrouillee par le thread courant, de- 
verrouille cette variable, puis bloque jusqu'a ce qu'un autre thread fasse un cond_signal 
ou un cond_broadcast pour la meme variable verrouillee. 

La variable bloquee par cond_wait est reverrouillee apres que le retour de cond_wait. 
Si de multiples threads font un cond_wait sur la meme variable, tous rebloquent sauf 
un car ils ne peuvent regagner le verrou sur la variable. Ainsi, si vous n'utilisez que 
cond_wait pour la synchronisation, abandonnez le verrou des que possible. 

La fonction cond_signal prend une variable deja verrouillee par le thread courant et 
debloque l'un des threads qui etait actuellement dans un cond_wait sur cette variable. 
Si plus d'un thread bloquait dans un cond_wait sur cette variable, un seul est debloque 
et vous ne pouvez pas predire lequel. Si aucun thread ne bloquait dans un cond_wait 
sur cette variable, l'evenement est elimine. 

La fonction cond_broadcast fonctionne comme cond_signal mais elle debloque toutes 
les threads bloques dans un cond_wait sur la variable verrouillee, non un seul thread. 
(Bien entendu, c'est toujours le cas s'il n'y a qu'un seul thread detenant le verrou.) 

La fonction cond_wait est destinee a etre le genre de chose qu'un thread n'emploie en 
dernier ressort que si la condition qu'il veut n'est pas remplie. Le cond_signal et le 
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cond_broadcast indiquent que la condition est en train de changer. Le deroulement des 
actions est suppose etre le suivant : verrouillez, puis verifiez pour voir si la condition 
que vous voulez est remplie ou non ; si c'est le cas, c'est bon, sinon, faites un cond_wait 
jusqu'a ce que ce soit bon. L'accent devrait etre mis sur le fait d'eviter de bloquer autant 
que possible. (C'est generalement un bon conseil lorsque Ton manipule des threads.) 

Voici un exemple oil le controle passe d'un thread a l'autre. Ne soyez pas bluffe par le 
fait que les conditions reelles sont releguees dans la partie droite des modificateurs 
d'instruction ; cond_wait ne sera jamais appele sauf si la condition que nous attendons 
est fausse. 

use Thread qw(async cond_wait cond_signal); 
my $var_wait = 0; 
async { 

lock $var_wait; 

$var_wait = 1; 

cond_wait $var_wait until $var_wait == 2; 

cond_signal($var_wait); 

$var_wait = 1; 

cond_wait $var_wait until $var_wait == 2; 
$var_wait = 1; 
cond_signal($wait_var); 

}; 

async { 

lock $var_wait; 

cond_wait $var_wait until $var_wait 
$var_wait = 2; 
cond_signal($var_wait); 
cond_wait $var_wait until $var_wait 
$var_wait = 2; 
cond_signal($wait_var); 
cond_wait $var_wait until $var_wait 

}; 

Autres modules de thread 

Plusieurs modules sont construits au-dessus de la primitive cond_wait. 
Files d'attente (queues) 

Le module standard Thread : : Queue fournit deux moyens de passer des objets entre des 
threads sans s'inquieter des verrous ou de la synchronisation. Cette interface est bien 
plus facile : 



Methode 


Utilisation 


new 


Construit un nouvel objet Thread : : Queue. 


enqueue 


Pousse un ou plusieurs scalaires a la fin de la file. 


dequeue 


Enleve le premier scalaire du debut de la file. La methode dequeue bloque 




s'il n'y a plus d'elements. 



== i; 
== i; 
== i; 
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Remarquez comme une file d'attente est similaire a un pipe ordinaire, sauf qu'au lieu 
d'envoyer des octets, vous arrivez a passer des scalaires purs et durs, y compris des refe- 
rences et des objets consacres avec bless. 

Voici un exemple derive de la page de manuel de perlthrtut : 

use Thread qw/async/; 
use Thread: :0ueue; 

my $0 = Thread: :0ueue->new(); 
async { 

while (defined ($donnee = $0->dequeue)) { 
print "$donnee retire de la file\n"; 

} 

}; 

$0->enqueue(l2); 
$0->enqueue("A", "B", "C"); 
$0->enqueue($thr); 
sleep 3; 

$0->enqueue(\%ENV); 
$0->enqueue(undef ) ; 

Et voici ce que vous obtenez comme affichage : 

12 retire de la file A retire de la file 
B retire de la file 
C retire de la file 

Thread=SCALAR(0x8ll7200) retire de la file 
HASH(Ox80dfd8c) retire de la file 

Remarquez comment $0 etait dans la portee lorsque le thread asynchrone a ete lance 
via une fermeture de async. Les threads respectent les memes regies concernant les por- 
tees que n'importe quoi d'autre en Perl. L'exemple ci-dessus n'aurait pas fonctionne si 
$0 avait ete declare apres l'appel a async. 

Semaphores 

Thread : : Semaphore vous fournit des objets semaphores, surs vis-a-vis des threads et ca- 
pables de compter, pour implementer vos operations favorites p() et v(). Comme la 
plupart d'entre nous n'associent pas ces operations avec les mots hollandais passeer 
(« passer ») et verlaat (« laisser »), le module appelle ces operations « down » (dimi- 
nuer) et « up » (augmenter), respectivement. (On trouvera dans la litterature, « wait » 
(attendre) ou « signal » (signaler).) Les methodes suivantes sont implementees : 



Methode 


Utilisation 


new 


Construit un nouvel objet Thread : : Semaphore. 


down 


Alloue un ou plusieurs elements. 


up 


Desalloue un ou plusieurs elements. 



La methode new cree un nouveau semaphore et initialise son compteur au nombre spe- 
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cifie. Si aucun nombre n'est specifie, le compteur du semaphore est positionne a 1. (Le 
nombre represente une certaine reserve d'element qui peut « s'epuiser » si tous les ele- 
ments sont desalloues.) 

use Thread: : Semaphore; 

$mutex = Thread: : Semaphore- >new($MAX); 

La methode down decremente le compteur du semaphore du nombre specifie, ou de 1 
si aucun nombre n'est donne. Elle peut etre interpretee comme une tentative d'alloca- 
tion d'une partie ou de la totalite d'une ressource. Si le compteur du semaphore des- 
cend en dessous de zero, cette methode bloque jusqu'a ce qu'elle compteur soit 
superieur ou egal a la quantite que vous avez demandee. Appelez-le comme ceci : 

$mutex->down(); 

La methode up incremente le compteur du semaphore du nombre specifie, ou de 1 si 
aucun nombre n'est donne. Elle peut etre interpretee comme une tentative de desallo- 
cation d'une certaine quantite d'une ressource precedemment allouee. Ceci debloque 
au moins un thread qui etait bloque en essayant de faire un down sur le semaphore, 
pourvu que le up augmente le compteur du semaphore au-dessus de ce que le down es- 
saie de le diminuer. Appelez-le comme ceci : 

$mutex->up(); 

Autres modules standard pour le traitement des threads 

Thread : : Signal vous permet de demarrer un thread qui est designe pour recevoir les 
signaux %SIC de votre processus. Ceci traite le probleme toujours vexant des signaux qui 
ne sont pas fiables tels qu'ils sont actuellement implementes dans Perl et leur utilisation 
imprudente peut de temps en temps causer des core dumps. 

Ces modules sont toujours en developpement et peuvent ne pas entramer l'effet es- 
compte sur votre systeme. D'un autre cote, ils peuvent produire les resultats desires. Si 
ce n'est pas le cas, c'est parce que quelqu'un comme vous ne les a pas corriges. Peut-etre 
que quelqu'un comme vous devrait se lancer et donner un coup de main. 
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Si vous etes venu ici pour trouver un compilateur Perl, vous serez peut-etre surpris d'ap- 
prendre que vous en avez deja un — votre programme perl (generalement /usr/bin/perl) 
renferme deja un compilateur Perl. Ce n'est peut-etre pas ce que vous pensiez et si tel est 
le cas, vous serez heureux d'apprendre que nous fournissons egalement des generateurs 
de code (que certaines personnes bien pensantes appellent « compilateurs ») et nous en 
discuterons vers la fin de ce chapitre. Mais nos voulons tout d'abord parler de ce que 
nous pensons etre Le Compilateur. II y aura inevitablement dans ce chapitre, une cer- 
taine quantite de petits details qui interesseront certains et ennuieront d'autres. Si vous 
pensez que vous n'etes pas interesse, considerez cela comme l'occasion d'entrainer vos 
facultes de lecture a grande vitesse. 

Imaginez que vous etes un chef d'orchestre ayant commande la partition pour une oeu- 
vre immense. Lorsque le coffret arrive, vous trouvez plusieurs douzaines de livrets, un 
pour chaque membre de l'orchestre, ne contenant que sa propre partition. Mais il man- 
que curieusement votre copie principale avec toutes les partitions. Encore plus curieu- 
sement, les partitions que vous avez ecrites vous-meme sont retranscrites en francais au 
lieu d'etre en notation musicale. Avant que vous puissiez mettre en place un concert sus- 
ceptible d'etre presente au public, ou meme simplement donner la musique a jouer a 
votre orchestre, il vous faudra traduire les descriptions en prose vers le systeme normal 
de notes et de mesures. Puis vous aurez besoin de compiler les partitions individuelles 
en une seule gigantesque pour que vous ayez une idee du programme dans son ensem- 
ble. 

De meme, lorsque vous remettez le code source de votre script Perl a l'executable perl 
pour qu'il l'execute, il n'est pas plus utile a l'ordinateur que ne l'etait la description en 
francais de la symphonie aux musiciens. Avant que votre programme puisse tourner, 
Perl a besoin de compiler 1 ces directives ressemblant a un langage naturel vers une re- 
presentation symbolique speciale. Votre programme ne tourne pourtant toujours pas 
car le compilateur ne fait que compiler. Comme la partition du chef d'orchestre, meme 



1. Ou traduire, ou transformer, ou transfigure r, ou transmuter, ou metamorphoser. 
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apres que votre programme a ete converti en un format d'instructions convenant a l'in- 
terpretation, il a encore besoin d'un agent actif pour interpreter ces instructions. 

Cycle de vie d'un programme Perl 

Vous pouvez decomposer le cycle de vie d'un programme Perl en quatre phases distinc- 
tes, chacune avec ses propres etapes independantes. La premiere et la derniere sont les 
plus interessantes et les deux du milieu sont optionnelles. Ces phases sont decrite a la 
figure 18-1. 



Generation 
de code 



Reconstruction de I 
I I'arbre dynamique 









Compilation 


Y ► 


Execution 



Figure 18-1. Le cycle de vie d'un programme Perl 



1. La phase de compilation 

Durant la phase 1, la phase de compilation, le compilateur convertit votre pro- 
gramme vers une structure de donnees appelee un arbre syntaxique. En plus des 
techniques traditionnelles d'analyse syntaxique, Perl en emploie une bien plus 
puissante : il utilise les blocs BEGIN pour guider toute compilation plus approfon- 
die. Les blocs BEGIN sont passes a l'interpreteur pour etre lances des qu'ils ont ete 
analyses, ce qui les lance effectivement dans l'ordre du premier arrive (FIFO -.first 
in, first out). Ceci comprend toutes les declarations use et no ; celles-ci ne sont que 
des blocs BEGIN deguises. Tous les blocs CHECK, INIT et END sont programmes par le 
compilateur pour une execution differee. 

Les declarations lexicales sont notees mais leurs affectations ne sont pas executees. 
Toutes les constructions eval BLOC, s///e et les expressions regulieres non interpo- 
lees sont compilees ici et les expressions constantes sont pre-evaluees. Le compila- 
teur a maintenant fini, a moins qu'il ne soit rappele au travail plus tard. A la fin de 
cette phase, l'interpreteur est a nouveau appele pour executer tous les blocs CHECK 
programmes dans l'ordre du dernier arrive (LIFO : last in, first out). La presence ou 
l'absence d'un bloc CHECK determine si nous allons ensuite a la phase 2 ou si nous 
sautons directement a la phase 4. 

2. La phase de generation de code (optionnelle) 

Les blocs CHECK sont installed par les generateurs de code ; cette phase optionnelle 
n'intervient done que si vous avez utilise explicitement l'un de ces generateurs de 
code (decrit plus tard dans Generateurs de codes). Ceux-ci convertissent le pro- 
gramme compile (mais non encore lance) soit en code source en C, soit en bytecode 
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Perl serialise — une sequence de valeurs exprimant des instructions Perl internes. 
Si vous choisissez de generer du code source en C, il peut eventuellement produire 
un fichier appele une image executable en langage machine natif. 2 
Arrive a ce point, votre programme se met en hibernation. Si vous avez fait une 
image executable, vous pouvez directement aller a la phase 4 ; sinon, vous devez 
reconstruire les bytecodes lyophilises en phase 3. 

3. La phase de reconstruction de I'arbre syntaxique (optionnelle) 

Pour reanimer le programme, son arbre syntaxique doit etre reconstruit. Cette 
phase n'existe que si la generation de code a eu lieu et si vous avez choisi de generer 
du bytecode. Perl doit tout d'abord reconstituer ses arbres syntaxiques a partir de 
cette sequence de bytecode avant que le programme puisse etre lance. Perl ne se 
lance pas directement a partir des bytecodes ; ce serait trop lent. 

4. La phase d'execution 

Finalement, ce que vous attendiez tous : faire tourner votre programme. 3 L'inter- 
preteur prend I'arbre syntaxique (qu'il obtient directement depuis le compilateur 
ou indirectement depuis la generation de code et la reconstruction consecutive de 
I'arbre) et l'execute. (Ou, si vous avez genere un fichier image executable, il peut 
etre lance en tant que programme independant puisqu'il contient un interpreteur 
Perl integre.) 

Au debut de cette phase, avant que ce ne soit a votre programme principal de se 
lancer, tous les blocs INIT programmes sont executes dans l'ordre du premier arrive 
(FIFO). Puis, votre programme principal est lance. L'interpreteur peut faire a nou- 
veau appel au compilateur comme cela est necessaire lorsqu'il rencontre un eval 
CHAINE, un do FICHIER ou une instruction require, une construction s///ee ou 
une reconnaissance de motif avec une variable interpolee contenant une assertion 
de code valide. 

Lorsque votre programme principal a fini, tous les blocs END differes sont finale- 
ment executes, cette fois-ci dans l'ordre du dernier arrive (LIFO). Le bloc vu en tout 
premier sera execute en dernier et ensuite vous aurez fini. (Les blocs END ne sont 
court-circuites que si vous appelez un exec ou si votre processus est balaye par une 
erreur catastrophique non interceptee. Les exceptions ordinaires ne sont pas consi- 
derees comme etant catastrophiques.) 

Maintenant nous allons discuter de ces phases plus en detail et dans un ordre different. 

Compilation du code 

Perl est toujours dans l'un des deux modes d'operation : soit il est en train de compiler 
votre programme, soit il est en train de l'executer — jamais les deux en meme temps. 



2. Votre script original est egalement un fichier executable mais il n'est pas en langage machine, 
nous ne l'appelons done pas une image. Un fichier image est appele ainsi car il s'agit d'une copie 
exacte des codes machine que votre CPU sait directement executer. 

3. N.d.T. : en anglais, faire tourner se dit run et par consequent, cette phase s'appelle egalement 
run phase. 
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Tout au long de ce livre, nous nous referons a certains evenements comme se deroulant 
a la compilation (compile time) ou alors nous disons que « le compilateur Perl fait ceci 
ou cela ». A d'autres endroits, nous mentionnons qu'autre chose se deroule a l'execu- 
tion (run time) ou que « l'interpreteur Perl fait ceci ou cela ». Bien que vous pouvez con- 
tinuer a vivre en pensant que « Perl » designe a la fois le compilateur et l'interpreteur, 
comprendre lequel de ces deux roles est en train de jouer Perl a un moment donne est 
essentiel pour comprendre pourquoi certaines choses se deroulent comme elles le font 
et non autrement. L'executable perl implemente les deux roles : tout d'abord le compi- 
lateur, puis l'interpreteur. (D'autres roles sont egalement possibles ; perl est aussi un op- 
timisateur et un generateur de code. Parfois, c'est meme un tricheur — mais tout cela 
dans la joie et la bonne humeur.) 

II est egalement important de comprendre la distinction entre la phase de compilation 
et la compilation (compilation time) ainsi qu'entre la phase d'execution et l'execution 
(run time). Une « phase » est un concept a grande echelle. Alors que la compilation et 
l'execution sont des concepts a petite echelle. Une phase de compilation donnee fait sur- 
tout des travaux de compilation, mais elle fait egalement quelques travaux d'execution 
via les blocs BEGIN. Une phase d'execution donnee fait surtout des travaux d'execution, 
mais elle fait egalement quelques travaux de compilation par l'intermediaire d'opera- 
teurs comme eval CHAINE. 

Dans le deroulement typique des evenements, le compilateur Perl lit le source de votre 
programme en entier avant que l'execution ne commence. C'est ici que Perl analyse les 
declarations, les instructions et les expressions pour s'assurer qu'elles sont syntaxique- 
ment valides. 4 S'il trouve une erreur de syntaxe, le compilateur tente de la corriger pour 
qu'il puisse rendre compte des erreurs suivantes dans le code source. Parfois, ceci fonc- 
tionne et parfois non ; les erreurs de syntaxe ont une tendance facheuse a declencher 
une cascade de fausses alertes. Perl abandonne, avec un sentiment de frustration, apres 
environ 10 erreurs. 

En plus de l'interpreteur qui traite les blocs BEGIN, le compilateur traite votre program- 
me avec la connivence de trois agents notionnels. Ceux-ci sont parfois appeles 
« lexemes » mais vous les rencontrerez plus souvent sous le nom de tokens dans les textes 
parlant des langages de programmation. L'analyseur lexical est parfois appele un tokener 
ou un scanner et ce qu'il fait est parfois appele de la lexicalisation (lexing) ou de la toke- 
nisation (tokening). Uanalyseur syntaxique (parser) essaie alors de degager un sens des 
groupes de tokens en les assemblant dans des constructions plus larges, comme des ex- 
pressions et des instructions, basees sur la grammaire du langage Perl. Voptimisateur 
rearrange et reduit ces regroupements plus larges en sequences plus efficaces. II choisit 
ses optimisations precautionneusement, sans perdre de temps sur des optimisations 
marginales car le compilateur Perl doit etre rapide comme l'eclair puisqu'il est utilise 
en mode load-and-go (c'est-a-dire que l'execution d'un programme est toujours precedee 
de sa compilation). 



4. Non, il riy a pas de diagramme de syntaxe formelle comme en syntaxe BNF (Backus-Naur 
Form), mais nous vous invitons a lire attentivement, dans l'arborescence des sources de Perl, le 
fichier perly.y, qui contient la grammaire yacc(l) que Perl utilise. Nous vous recommandons de 
vous tenir le plus loin possible de l'analyseur lexical, qui est connu pour avoir provoque des trou- 
bles alimentaires chez des rats de laboratoire. 
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Ceci ne se produit pas dans des etapes independantes mais d'un seul coup avec enorme- 
ment de dialogues croises entre les agents. L'analyseur lexical a parfois besoin dedica- 
tions de la part de l'analyseur syntaxique pour lever les ambiguites sur les differents 
types possibles des tokens qu'il regarde. (Curieusement, la portee lexicale est Fune des 
choses que l'analyseur lexical ne comprend pas car c'est l'autre sens de « lexique ».) L'op- 
timisateur a egalement besoin de garder une trace de ce que l'analyseur syntaxique est 
en train de faire car certaines optimisations ne peuvent etre faites avant que l'analyseur 
syntaxique n'ait atteint un certain point, tel que la fin d'une expression, d'une instruc- 
tion, d'un bloc ou d'un sous-programme. 

Vous pouvez trouver etrange que le compilateur Perl fasse toutes ces choses en une fois 
plutot que les unes apres les autres mais il s'agit certainement du meme processus con- 
fus que lorsque vous essayez de comprendre un langage naturel a la volee alors que vous 
etes en train de l'ecouter ou de le lire. Vous n'attendez pas la fin d'un chapitre pour com- 
prendre ce que la premiere phrase voulait dire. Vous pourriez pensez aux correspondan- 
ces suivantes : 



Langage informatique 


Langage naturel 


Caractere 


Lettre 


Token 


Morpheme 


Terme 


Mot 


Expression 


Proposition 


Instruction 


Phrase 


Bloc 


Paragraphe 


Fichier 


Chapitre 


Programme 


Histoire 



En supposant que l'analyse syntaxique se passe bien, le compilateur estime que ce que 
vous lui avez passe en entree est une histoire valide — heu, pardon, un programme va- 
lide. Si vous utilisez l'option -c lorsque vous lancez votre programme, il affiche un mes- 
sage « syntax OK » et se termine. Sinon, le compilateur passe les fruits de ses efforts aux 
autres agents. Ces « fruits » se presentent sous forme d'un arbre syntaxique. Chaque 
fruit de l'arbre — ou chaque nceud, comme on les appelle — represente l'un des codes 
d'operation (opcodes) internes de Perl et les branches de l'arbre representent le schema 
devolution de cet arbre. Eventuellement, les nceuds seront enchaihes de maniere li- 
neaire, les uns apres les autres, pour indiquer l'ordre dans lequel le systeme d'execution 
devra les passer en revue. 

Chaque code d'operation est la plus petite unite d'instruction executable que Perl peut 
apprehender. Vous pourriez rencontrer une expression telle que $a = -($b + $c) com- 
me etant une seule instruction mais Perl l'apprehende comme six codes d'operation se- 
pares. Presente sous un format simplifie, l'arbre syntaxique pour cette expression 
ressemblerait a la figure 18-2. Les numeros representent l'ordre de parcours que le syste- 
me d'execution de Perl suivra eventuellement. 

Perl n'est pas un compilateur travaillant en une seule passe comme certains pourraient 
le penser. (Les compilateurs travaillant en une seule passe sont tres doues pour rendre 
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Figure 18-2. Ordre de parcours des codes d 'operation de $a = -($b +$c) 

les choses faciles a l'ordinateur et difficiles au programmeur.) II s'agit reellement d'un 
compilateur multipasse, faisant des optimisations et consistant en au moins trois passes 
logiques differentes, qui dans la pratique s'entremelent. Les passes 1 et 2 sont lancees en 
alternance alors que le compilateur fait des allers-retours a toute vitesse le long de Far- 
bre syntaxique durant sa construction ; la passe 3 se produit des qu'un sous-programme 
ou qu'un fichier est entierement analyse. Voici ces differentes passes : 

Passe 1 : Analyse ascendante (Bottom-up parsing) 

Durant cette passe, Farbre syntaxique est construit par Fanalyseur syntaxique 
yacc{\) en utilisant les tokens qu'on lui donne a partir de Fanalyseur lexical sous- 
jacent (qui pourrait etre considere comme une autre phase logique a titre indivi- 
duel). « Ascendante » signifie seulement que Fanalyseur syntaxique connait les 
feuilles de Farbre avant ses branches et sa racine. II calcule vraiment les choses de 
bas en haut dans la figure 18-2, puisque nous avons dessine la racine en haut, dans 
la pure tradition idiosyncratique des informaticiens. (Et des linguistes.) 
Alors que chaque nceud contenant un code d'operation est construit, une verifica- 
tion de bon sens par code d'operation est effectuee pour controler si la semantique 
est valide, comme le bon nombre et le type correct des arguments utilises pour 
appeler les fonctions internes. Alors que chaque sous-section de Farbre prend 
forme, Foptimisateur estime les transformations qu'il peut appliquer au sous-arbre 
entier se trouvant maintenant sous son emprise. Par exemple, une fois qu'il sait 
qu'une liste de valeurs est passee a une fonction prenant un certain nombre d'argu- 
ments, il peut se defaire du code d'operation qui enregistre le nombre d'arguments 
pour les fonctions en acceptant un nombre variable. Une optimisation plus impor- 
tante, connue sous le nom de precalcul des expressions constantes (constant folding), 
est decrite plus loin dans ce paragraphe. 

Cette passe construit egalement Fordre de parcours des nceuds utilise plus tard 
pour l'execution, ce qui est une astuce vraiment geniale car le depart du parcours 
n'est presque jamais le noeud superieur. Le compilateur realise une boucle tempo- 
raire des codes d'operation, avec le nceud superieur pointant sur le premier code 
d'operation a parcourir. Lorsque le noeud superieur est incorpore dans quelque 
chose de plus gros, cette boucle de codes d'operation est brisee, uniquement pour 
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engendrer une boucle plus grosse avec le nouveau nceud superieur. La boucle est 
eventuellement brisee pour de bon lorsque le noeud de depart est pousse dans une 
autre structure comme un descripteur de sous-programme. L'appelant du sous-pro- 
gramme peut toujours retrouver ce premier code d'operation bien qu'il soit dans 
les profondeurs de l'arbre, comme c'est le cas dans la figure 18-2. L'interpreteur n'a 
aucun besoin de revenir en bas de l'arbre pour arriver a comprendre par oil com- 
mencer. 

Passe 2 : Optimisateur descendant (Top-down optimizer) 

Une personne lisant un extrait d'un code Perl (ou d'un code francais, pour ce qui 
nous preoccupe ici) ne peut determiner le contexte sans examiner les elements lexi- 
caux l'entourant. Vous ne pouvez parfois pas decider ce qui se passe reellement 
jusqu'a ce que vous ayez plus d'informations. Que cela ne vous afflige pas pour 
autant car vous n'etes pas seul : le compilateur non plus. Dans cette passe, le compi- 
lateur redescend le sous-arbre qu'il vient de construire pour appliquer des optimisa- 
tions locales, dont la plus remarquable est la propagation de contexte. Le compilateur 
marque les nceuds avec les contextes appropries (vide, scalaire, liste, reference ou 
lvalue) imposes par le nceud courant. Les codes d'operation superf lus sont annules, 
mais non supprimes, car il est maintenant trop tard pour reconstruire l'ordre d'exe- 
cution. Nous compterons sur la troisieme passe pour les enlever de l'ordre d'execu- 
tion provisoire determine par la premiere passe. 

Passe 3 : Optimisateur a lucarne (Peephole optimizer) 

Certaines unites de code ont leur propre espace de stockage dans lequel elles con- 
servent leurs variables de portee lexicale. (De tels espace sont appeles memoires de 
travail ou scratchpads dans le jargon de Perl.) Ces unites comprennent les eval 
CHAINE, les sous-programmes et les fichiers entiers. D'une maniere importante du 
point de vue de l'optimisateur, elles ont chacune leur propre point d'entree, ce qui 
signifie qu'alors que nous connaissons l'ordre d'execution a partir d'ici, nous ne 
pouvons pas connaitre ce qui s'est passe auparavant car la construction a pu etre 
appelee de n'importe ou. Ainsi, lorsque l'une de ces unites a fini d'etre analysee, 
Perl lance un optimisateur regardant par une lucarne, sur ce code. Au contraire des 
deux passes precedentes, qui parcouraient la structure de branche de l'arbre syntaxi- 
que, cette passe-ci parcours le code dans un ordre d'execution lineaire, puisqu'elle 
constitue a la base la derniere opportunity de le faire avant que nous isolions la 
liste de codes d'operation de l'analyseur syntaxique. La plupart des optimisations 
ont deja ete effectuees dans les deux premieres passes mais certaines ne le pou- 
vaient pas. 

Des optimisations variees de derniere minute se produisent ici, y compris l'assem- 
blage de l'ordre d'execution final en court-circuitant les codes d'operation nuls et le 
fait de detecter lorsque diverses juxtapositions de codes d'operation peuvent etre 
reduites a quelque chose de plus simple. L'identification d'une serie de concatena- 
tions de chames est une optimisation importante puisque vous aimeriez vraiment 
eviter de copier la meme chaine encore et encore a chaque fois que vous ajoutez un 
petit quelque chose a la fin. Cette passe ne fait pas que de l'optimisation ; il realise 
egalement une grande quantite de travail « reel » : l'interception de mots simples 
(barewords), la generation d'avertissements sur des constructions douteuses, la 
recherche de code peu susceptible d'etre atteint, la resolution de clefs de pseudo- 
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hachages et la recherche de sous-programmes appeles avant que leurs prototypes 
n'aient ete" compiles. 

Passe 4 : Generation de code (Code generation) 

Cette passe est optionnelle ; elle n'est pas utilisee dans le deroulement normal des 
evenements. Mais si l'un des trois generateurs de code — B : : Bytecode, B : : C ou 
B : : CC — est invoque, on accede une derniere fois a l'arbre syntaxique. Les genera- 
teurs de code emettent soit les bytecodes Perl serialises utilises plus tard pour 
reconstruire l'arbre syntaxique, soit du code litteral C representant l'etat de l'arbre 
syntaxique a la compilation. 

La generation de code C est disponible en deux varietes differentes. B : : C recons- 
truit simplement l'arbre syntaxique et le lance en utilisant la boucle habituelle 
runopsQ que Perl lui-meme utilise durant l'execution. Tandis que B:CC produit un 
equivalent C linearise et optimise du chemin emprunte par le code d'execution 
(qui ressemble a une table de branchements (jump table) geante) et l'execute. 

Pendant la compilation, Perl optimise votre code de manieres tres, tres, diverses. II rear- 
range le code pour le rendre plus efficace a l'execution. II supprime le code qui ne pour- 
ra jamais etre atteint durant l'execution, comme un bloc if (o) ou les blocs elsif et 
else avec un bloc if (l). Si vous utilisez des variables lexicalement typees, declarees 
avec my NomClasse $var ou our NomClasse $var et que le paquetage NomClasse avait 
ete initialise avec le pragma use fields, les acces aux champs constants depuis le pseudo- 
hachage sous-jacent sont verifies pour y detecter des fautes de frappe et convertis en ac- 
ces a un tableau. Si vous donnez a l'operateur sort une routine de comparaison suffi- 
samment simple, comme {$a <=> $b} ou {$b cmp $a}, celle-ci est remplacee par un 
appel a du code C compile. 

L'optimisation la plus impressionnante de Perl est probablement la maniere dont il re- 
sout les expressions constantes des que possible. Considerez par exemple l'arbre syntaxi- 
que presente a la figure 18-2. Si les nceuds et 2 avaient tous deux ete des litteraux ou des 
fonctions constantes, les nceuds 1 a 4 auraient ete remplaces par le resultat de ce calcul, 
ce qui aurait donne quelque chose comme la figure 18-3. 




Figure 18-3. Pre'calcul de constantes 

On appelle ceci le precalcul d'expressions constantes (constant folding). Ce precalcul ne se 
limite pas a des cas simples comme la conversion a la compilation de 2**10 en 1024. II 
resout egalement les appels de fonctions — a la fois les fonctions internes et les sous- 
programmes declares par l'utilisateurs remplissant les criteres de la section lnclure par 
reference les fonctions constantes au chapitre 6, Sous-programmes. En reminiscence des com- 
pilateurs FORTRAN, celebres pour leur connaissance de leurs propres fonctions intrin- 
seques, Perl sait egalement laquelle de ses fonctions internes appeler durant la 
compilation. C'est pourquoi lorsque vous essayez de prendre le log de 0.0 ou la racine 
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carree (sqrt) d'une constante negative, vous encourez une erreur de compilation et non 
d'execution, et l'interpreteur n'est pas lance du tout. 5 

Meme les expressions arbitrairement complexes sont resolues tres tot, en declenchant 
parfois la suppression de blocs entiers comme celui-ci : 

if (2 * sin(l)/cos(l) < 3 && unefoncQ { nimportequoiQ } 

Aucun code n'est genere pour ce qui ne pourra jamais etre evalue. Comme la premiere 
partie est toujours fausse, ni une_f one, ni n_importe_quoi ne seront jamais appeles. (Ne 
vous attendez done pas a faire un goto sur des etiquettes a l'interieur de ce bloc car il 
n'existera meme pas a l'execution.) Si une_f one etait une fonction constante susceptible 
d'etre incluse par reference (inlinable), sa valeur aurait juste ete inseree comme si e'etait 
une constante litterale. Vous auriez alors encouru un avertissement « Useless use of a 
constant in void context » (Utilisation inutile d'une constante dans un contexte vide). Ceci 
pourrait vous surprendre si vous n'aviez pas realise que e'etait une constante. Toutefois, 
si n_importe_quoi etait la derniere instruction evaluee dans une fonction appelee dans 
un contexte non vide (tel que l'optimisateur le determine), vous n'auriez jamais vu 
l'avertissement. 

Vous pouvez voir le resultat final de l'arbre syntaxique construit apres toutes les etapes 
d'optimisation avec perl -Dx. (L'option -D exige une version special e de Perl, permettant 
le debogage) Voir egalement le paragraphe sur B: :Deparse decrit ci-dessous. 

En fin de compte, le compilateur Perl travaille dur (mais pas trop dur) pour optimiser 
le code afin que, lorsqu'arrive le moment de l'execution, celle-ci soit acceleree. C'est le 
moment oil votre programme est lance, alors occupons-nous en maintenant. 

Execution du code 

A premiere vue, les programmes Sparc ne tournent que sur des machines Sparc, les pro- 
grammes Intel ne tournent que sur des machines Intel et les programmes Perl ne tour- 
nent que sur des machines Perl. Une machine Perl possede des qualites qu'un 
programme Perl trouverait ideales dans un ordinateur : une memoire qui s'alloue et se 
desalloue automatiquement, des types de donnees fondamentaux qui sont des chaines, 
des tableaux et des hachages dynamiques et n'ont pas de limite de taille et des systemes 
qui se comportent a peu pres toujours de la meme facon. Le travail de l'interpreteur 
Perl est de faire que n'importe quel ordinateur sur lequel il tourne, apparaisse comme 
l'une de ces machines Perl ideales. 

Cette machine Active presente l'illusion d'un ordinateur specialement concu pour ne 
rien faire tourner d'autre que des programmes Perl. Chaque code d'operation (opcode) 
produit par le compilateur est une commande fondamentale dans cet ensemble d'ins- 
tructions emulees. Au lieu d'un compteur de programme materiel, l'interpreteur ne 
garde que la trace du code d'operation courant a executer. Au lieu d'un pointeur de pile 
materiel, l'interpreteur possede sa propre pile virtuelle. Cette pile est tres importante 



5. En fait, nous simplifions ici a l'extreme. L'interpreteur est bien lance car c'est de cette 
maniere que le precalcul de constantes est implemente. Mais il est immediatement lance a la 
compilation, de la meme facon que les blocs BEGIN sont executes. 
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car la machine virtuelle Perl (que nous refusons d'appeler une PVM 6 ) est une machine 
reposant sur des operations de pile. Les codes d'operation de Perl sont appele en interne 
des codes PP (abreviation de codes « push-pop », « empiler-depiler ») car ils manipulent 
la pile virtuelle de l'interpreteur pour trouver toutes les operandes, traiter les valeurs 
temporaires et stacker tous les resultats. 

Si vous avez jamais programme en Forth ou en PostScript ou utilise une calculatrice 
scientifique HP avec une saisie en RPN (« Reverse Polish Notation », notation polonaise 
inversee), vous savez comment fonctionne une machine basee sur des operations de pi- 
le. Meme si ce n'est pas le cas, le concept est simple : pour ajouter 3 et 4, vous faites les 
choses dans l'ordre 3 4 + au lieu de l'ordre conventionnel 3 + 4. Ce qui signifie en ter- 
mes d'operations de pile que vous empilez 3, puis 4 et + depile ensuite les deux argu- 
ments, les additionne et remet 7 dans la pile, oil il restera jusqu'a ce que vous en fassiez 
quelque chose. 

Compare au compilateur Perl, l'interpreteur Perl est un programme rigoureux, pres- 
qu'ennuyeux. Tout ce qu'il fait est de parcourir pas a pas les codes d'operation compiles, 
un a un, et de les acheminer vers l'environnement d'execution de Perl, c'est-a-dire, vers 
la machine virtuelle Perl. C'est juste un tas de code C, n'est-ce pas ? 

En fait, ce n'est pas du tout ennuyeux. Une machine virtuelle Perl garde la trace d'une 
grande quantite de contextes dynamiques a votre place pour que vous n'ayez pas a le fai- 
re. Perl entretient un bon nombre de piles, que vous n'avez pas a connaitre, mais que 
nous enumererons ici, seulement pour vous epater : 

pile d'operandes (operand stack) 

II s'agit de la pile dont nous avons deja parle. 

pile de sauvegardes (save stack) 

La oil sont sauvegardees les valeurs declarees locales en attendant d'etre restaurees. 
Plusieurs routines internes declarent egalement des valeurs comme etant locales 
sans que vous le sachiez. 

pile de portees (scope stack) 

Le contexte dynamique poids plume, qui controle le moment oil la pile de sauve- 
gardes doit etre depilee. 

pile de contextes (context stack) 

Le contexte dynamique poids lourd ; qui a appele qui pour en arriver la oil vous 
etes. La fonction caller parcourt cette pile. Les fonctions de controle de boucle exa- 
minent cette pile pour trouver quelle boucle controler. Lorsque vous epluchez la 
pile de contexte, la pile de portees est epluchee en consequence, ce qui restaure tou- 
tes vos variables locales a partir de la pile de sauvegardes, meme si vous aviez quitte 
le contexte precedent par le biais de precedes infames comme de lever une excep- 
tion et sortir avec un longjmp(3). 

pile de changements d'environnement (jumpenv stack) 

La pile des contextes de longjmp(3) qui nous permettent de lever des exceptions ou 
de quitter le programme de maniere expeditive. 



6. N.d.T. : PVM est l'acronyme habituel de Parallel Virtual Machine, machine parallele virtuelle. 
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pile de retours (return stack) 

La d'oti nous sommes partis lorsque nous sommes entres dans ce sous-programme. 

pile de repere (mark stack) 

La oil commence, dans la pile d'operandes, la liste d'arguments courante pour les 
fonctions avec un nombre variable d'arguments (variadic). 

piles de memoires de travail lexicales recursives (recursive lexical pad stacks) 

La oil sont stockes les variables lexicales et les autres « registres de memoires de tra- 
vail » (scratch register) lorsque les sous-programmes sont appeles recursivement. 

Bien entendu, il y a la pile C dans laquelle sont stockees toutes les variables C. Perl essaie 
en fait d'eviter de se reposer sur la pile du C pour le stockage de valeurs sauvegardees, 
puisque longjmp(3) court-circuite la restauration appropriee de telles valeurs. 

Tout ceci pour dire que la vision habituelle que Ton a d'un interpreteur, un programme 
qui en interprete un autre, est vraiment inadequate pour decrire ce qui se passe ici. Oui, 
il existe du code C implementant des codes d'operation mais lorsque nous parlons 
d'« interpreteur », nous voulons dire quelque chose de plus que cela, de la meme ma- 
niere que lorsque nous parlons de « musicien », nous voulons dire quelque chose de 
plus qu'un ensemble d' instructions d'ADN changeant les notes en sons. Les musiciens 
sont des organismes reels, vivants et ont une « condition ». II en va de meme pour les 
interpreteurs. 

En particulier, tout ce contexte dynamique et lexical, ainsi que les tables de symboles 
globales, plus l'arbre syntaxique, plus un thread d'execution, est ce que nous appelons 
un interpreteur. En tant que contexte d'execution, un interpreteur commence son exis- 
tence avant meme que le compilateur ne demarre et il peut se lancer dans une forme 
rudimentaire pendant meme que le compilateur est en train de construire le contexte 
de l'interpreteur. En fait, c'est precisement ce qui arrive lorsque le compilateur appelle 
l'interpreteur pour executer des blocs BEGIN et d'autres choses dans le meme genre. Et 
l'interpreteur peut se retourner et utiliser le compilateur pour se construire davantage. 
Chaque fois que vous definissez un autre sous-programme ou que vous chargez un autre 
module, la machine virtuelle Perl particuliere que nous appelons un interpreteur se re- 
definit elle-meme. Vous ne pouvez pas vraiment dire si c'est le compilateur ou l'inter- 
preteur qui a le controle car ils cooperent pour controler le processus d'amorcage 
(bootstrap process) que nous appelons communement « lancer un script Perl ». C'est 
comme lorsqu'on amorce le cerveau d'un enfant. Est-ce l'ADN qui le fait ou les 
neurones ? Un peu des deux, selon nous, avec quelques interventions de programmeurs 
externes. 

II est possible de lancer de multiples interpreteurs dans le meme processus ; ils peuvent 
ou non partager des arbres syntaxiques, selon qu'ils ont demarre en clonant un inter- 
preteur existant ou en construisant un nouvel interpreteur a partir de zero. II est egale- 
ment possible de lancer de multiples threads dans un seul interpreteur, auquel cas ils ne 
partagent pas seulement des arbres syntaxiques mais egalement les symboles globaux 
— voir le chapitre 17, Threads. 

Mais la plupart des programmes Perl n'utilisent qu'un seul interpreteur Perl pour exe- 
cuter leur code compile. Et alors que vous pouvez lancer de multiples interpreteurs Perl 
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independants dans un seul processus, FAPI actuelle pour ceci n'est accessible qu'en C. 7 
Chaque interpreteur Perl individuel joue le role d'un processus completement separe 
mais ne coute pas autant que la creation d'un nouveau processus complet. C'est ainsi 
que l'extension mod_perl d'Apache obtient de telles performances : lorsque vous lancez 
un script CGI sous mod_perl, ce script a deja ete compile en codes d'operation Perl, evi- 
tant ainsi le besoin de le recompiler — mais, ce qui est plus important encore, en evitant 
le besoin de demarrer un nouveau processus, ce qui constitue le veritable goulot 
d'etranglement. Apache initialise un nouvel interpreteur Perl dans un processus exis- 
tant et passe a cet interpreteur le code precedemment compile pour qu'il l'execute. Bien 
entendu, c'est un peu plus complique que cela — c'est toujours un peu plus complique. 
Pour plus d'informations sur mod_perl, voir Writing Apache Modules with Perl and C 
(O'Reilly, 1999). 

Plusieurs autres applications, comme nvi, vim et innd, peuvent integrer des interpreteurs 
Perl ; nous ne pouvons pas esperer les lister toutes ici. II existe un bon nombre de pro- 
duits commerciaux qui ne font meme pas la publicite pour le moteur Perl qu'ils ont in- 
tegre. lis l'utilisent seulement en interne car il accomplit leur travail avec classe. 

Sorties du compilateur 

Ainsi, si Apache peut compiler un programme Perl maintenant et l'executer plus tard, 
pourquoi pas vous ? Apache et d'autres programmes contenant des interpreteurs Perl 
integres le font facilement — ils ne stockent jamais l'arbre syntaxique dans un fichier 
externe. Si cette approche vous convient et que vous cela ne vous embete pas d'utiliser 
FAPI C pour en beneficier, vous pouvez faire la meme chose. Voir le paragraphe « Inte- 
grer du Perl » au chapitre 21, Mecanismes internes et acces externes pour apprendre com- 
ment acceder a Perl depuis une infrastructure C l'entourant. 

Si vous ne voulez pas prendre cette route ou si vous avez d'autres besoins, vous disposez 
alors de plusieurs options. Au lieu d'alimenter immediatement Finterpreteur Perl avec 
les codes d'operation issus du compilateur Perl, vous pouvez invoquer l'une des nom- 
breuses autres sorties (backends). Ces sorties peuvent serialiser et stacker les codes d'ope- 
ration compiles dans un fichier externe ou meme les convertir en deux varietes 
differentes de code C. 

Merci de bien prendre conscience que les generateurs de code sont tous des utilitaires 
extremement experimentaux qui ne devraient pas esperer fonctionner dans un environ- 
nement de production. En fait, ils ne devraient meme pas esperer fonctionner dans un 
environnement de non-production, sauf peut-etre une fois tous les 36 du mois. Mainte- 
nant que nous avons assez rabaisse vos illusions pour que toute reussite les surpasse ne- 
cessairement, nous pouvons vous parler en toute securite du fonctionnement des 
sorties du compilateur. 

Certains des modules de sortie (backend) sont des generateurs de code, comme B: :By- 
tecode, B : : C et B : : CC. Les autres sont reellement des analyseurs de code et des outils de 



7. Avec une exception jusqu'ici : la version 5.6.0 de Perl peut doner des interpreteurs dans 
Fimplementation de Femulation de fork sur Microsoft Windows. II pourrait bien y avoir une 
API Perl pour les « ithreads » , comme on les appelle, au moment oil vous lirez ceci. 
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debogage, comme B: :Deparse, B: : Lint et B: :Xref. Au-dela de ces sorties, la distribu- 
tion standard inclut plusieurs autres modules de bas niveau d'un interet potentiel pour 
ceux desirant devenir auteurs d'outils Perl de developpement de code. D'autres modules 
de sortie peuvent etre trouves sur CPAN, comprenant (au moment ou ces lignes sont 
ecrites) B: :Fathom, B: :Graph, B: :DVM: : Jasmin et B: :Size. 

Lorsque vous utilisez le compilateur Perl pour autre chose que l'alimentation de l'inter- 
preteur, le module 0 (c'est-a-dire en utilisant le fichier O.pm) se tient entre le compila- 
teur et les modules de sorties varies. Vous n'appelez pas les sorties directement : vous 
appelez plutot la partie intermediaire, qui a son tour appelle la sortie designee. Ainsi, 
si vous aviez un module appele B : : Backend, vous l'invoqueriez dans un script donne de 
cette maniere : 

% perl -MO=Backend NOM_SCRIPT 

Certaines sorties prennent des options, specifiers comme ceci : 

% perl -MO=Backend OPTS NOM_SCRIPT 

Certaines sorties ont deja leur propre frontal pour invoquer leurs parties intermediaries 
pour vous afin que vous n'ayez pas a vous souvenir de leur M.O. En particulier, perlcc(l) 
invoque ce generateur de code, qui peut etre encombrant a lancer. 

Generateurs de code 

Les trois sorties actuelles qui convertissent des codes d'operation Perl en un autre format 
sont toutes emphatiquement experimentales. (Oui, nous l'avons deja dit mais nous ne 
voulons pas que vous l'oubliiez.) Meme lorsqu'il arrive qu'ils produisent en sortie quel- 
que chose qui se lance correctement, les programmes resultants peuvent prendre plus 
d'espace disque, plus de memoire et plus de temps CPU qu'ils ne le feraient d'ordinaire. 
Ceci est un sujet encore en recherche et developpement. Les choses vont s'ameliorer. 

Le generateur de bytecode 

Le module B : : Bytecode ecrit les codes d'operation de l'arbre syntaxique dans un enco- 
dage independant de la plate-forme. Vous pouvez prendre un script Perl compile en by- 
tecode et copier cela sur une autre machine ou Perl est installe. 

La commande standard, bien qu'actuellement experimentale, perlcc(\) sait comment 
convertir du code source Perl en un programme Perl compile en bytecode. Tout ce que 
vous devez faire est : 

% perlcc -B scriptsrc > scriptpby 

Et vous devriez maintenant etre capable d'« executer » directement le script _pby resul- 
tant. Le debut de ce fichier ressemble a quelque chose comme ceci : 

#!/usr/bin/perl 

use ByteLoader 0.04; 

PLBCi386-linux A (80.04 A @ A D A @ A |5) A |a) A D A |a) A (5l A |a)Oxl234 A (a) A G 

A C A @ A @ A @ A @ A F A A A C A A A @ A @ A @ A G A @ A C A B A @ A @ A @ A G A @ A C A C A @ A @ A @ A G A @ A C A D A 

A (5) A @ A G A @ A C A E A @ A (!i) A @ A G^ 
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Vous devriez trouver un petit en-tete de script suivit par des donnees purement binaires. 
Cela peut ressembler a de la pure magie mais son mystra, heu. . . mystere n'est pas tres 
puissant. Le module ByteLoader utilise une technique appelee filtre de source pour alte- 
rer le code source avant que Perl n'ait une chance de le voir. Un filtre de source est un 
genre de preprocesseur s'appliquant a tout ce qui se trouve en dessous de lui dans le fi- 
chier courant. Au lieu d'etre limite a des transformations simplistes comme les prepro- 
cesseurs de macros comme le sont cpp(l) et m4{\), il n'y a ici aucune limitation. Les 
filtres de source ont ete utilises pour enrichir la syntaxe de Perl, pour compresser ou 
crypter du code source et meme pour ecrire des programmes Perl en latin. E perlibus 
Unicode; cogito, ergo substr; carp dbm, et al. Heu, avertissement du scriptor, desole, du 
scribe latin. 

Le module ByteLoader est un filtre de source qui sait comment disassembler les codes 
d'operation serialises pour reconstruire l'arbre syntaxique original. Le code Perl recons- 
titue est integre dans l'arbre syntaxique actuel sans utiliser le compilateur. Lorsque l'in- 
terpreteur rencontre ces codes d'operation, il n'a qu'a les executer comme s'ils etaient ici 
depuis toujours, n'attendant que ca. 

Les generateurs de code C 

Les autres generateurs de codes, B : : C et B : : CC, produisent tous deux du code C au lieu 
de codes d'operation Perl serialises. Le code qu'ils generent est loin d'etre lisible et si 
vous essayez de le lire, vous risquez de devenir aveugle. Ce n'est pas quelque chose que 
vous pouvez utiliser pour inserer quelques morceaux de code Perl traduit en C dans un 
programme C plus vaste. Pour faire cela, voir le chapitre 21. 

Le module B : : C ne fait qu'ecrire les structures de donnees C necessaires pour recreer 
Fenvironnement d'execution Perl complet. Vous obtenez un interpreteur Perl dedie 
avec toutes les structures de donnees internes preinitialisees. En un certain sens, le code 
genere ressemble a celui que produit B: :Bytecode. Les deux sont une traduction litte- 
rale des arbres de codes d'operation que construit le compilateur mais la oil B::Bytecode 
les laisse sous forme symbolique pour etre recrees plus tard et branches dans un inter- 
preteur Perl deja lance, B : : C laisse ces codes d'operation en C. Lorsque vous compilez ce 
code C avec votre compilateur C et que vous faites l'edition de liens avec la bibliotheque 
Perl, le programme resultant n'aura pas besoin d'un interpreteur Perl installe sur le sys- 
teme cible. (II pourra cependant avoir besoin de bibliotheques partagees, si vous n'avez 
pas fait une edition de liens statique pour tous les objets.) Cependant, ce programme 
n'est pas vraiment different de l'interpreteur Perl normal qui lance votre script. II est 
seulement pecompile dans une image executable de maniere isolee. 

Le module B : : CC essaie toutefois d'en faire plus. Le debut du fichier source C qu'il ge- 
nere ressemble un peu a ce que produit B : : C 8 mais, eventuellement, toute ressemblance 
s'arrete la. Dans le code de B : : C, vous avez une enorme table de codes d'operation en C 
qui est manipulee exactement de la meme maniere que l'interpreteur l'aurait fait tout 
seul, alors que dans le code C genere par B : : CC est presente dans l'ordre correspondant 
au flux d'execution de votre programme. II possede meme une fonction C correspon- 



8. Mais alors, comme c'est le cas pour tout, une fois que vous etes devenu aveugle. Est-ce que 
nous ne vous avions pas prevenu de ne pas jeter de coup d'ceil ? 
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dant a chaque fonction de votre programme. Une certaine quantite d'optimisations ba- 
sees sur le type des variables est accomplie ; quelques benchmarks peuvent tourner deux 
fois plus vite que dans l'interpreteur standards. Ceci est le plus ambitieux des genera- 
teurs de code actuels, celui qui represente le plus grand espoir pour l'avenir. Et ce n'est 
pas une coincidence si c'est egalement le moins stable des trois. 

Les etudiants en informatique recherchant des projets de these n'ont pas besoin de cher- 
cher ailleurs. II y a ici une montagne de diamants attendant d'etre affines. 



Outils de developpement de code 

Le module 0 possede de nombreux modi operandi interessants autres que l'alimenta- 
tion des generateurs de codes desesperement experimentaux. En fournissant un acces 
relativement indolore a la sortie du compilateur Perl, ce module facilite l'ecriture 
d'autres outils ayant besoin de tout savoir a propos d'un programme Perl. 

Le module B: : Lint est ainsi baptise d'apres lint{\), le verificateur de programmes C. II 
inspecte les programmes a la recherche de constructions douteuses qui egarent souvent 
les debutants mais qui, normalement, ne declenchent pas d'avertissements. Appelez le 
module directement : 

% perl -MO=Lint,all monprog 

Seules quelques verifications sont actuellement definies, comme l'emploi d'un tableau 
dans un contexte scalaire implicite, le fait de se fier a des variables par defaut et Faeces 
a des identificateurs d'un autre paquetage, commencant par _ (normalement prives). 
Voir B::Lint(3) pour plus de details. 

Le module B: :Xref genere des listes avec les references croisees des declarations et des 
utilisations de toutes les variables (a la fois globales et de portee lexicale), de tous les 
sous-programmes et des tous les formats dans un programme, repartis par fichier et par 
sous-programme. Appelez le module de cette maniere : 

% perl -M0=Xref mon_prog > mon_prog.pxref 

Voici, par exemple, un extrait de compte-rendu : 

Subroutine analyseargv 
Package (lexical) 

$allume ill3, 114 

$opt ill3, 114 

%config_getopt il07, 113 

(5>args_config ill2, 114, 116, 116 
Package Getopt::Long 

$ignorecase 101 

&GetOptions &124 
Package main 

$0ptions 123, 124, 141, 150, 165, 169 

%$0ptions 141, 150, 165, 169 

Sverif ie_lecture &167 

@ARCV 121, 157, 157, 162, 166, 166 

Ceci montre que la routine analyse_argv avait quatre variables lexicales propres ; elle 
accedait egalement a des identificateurs globaux des paquetages main et Cetopt : : Long. 
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Les nombres representent les lignes oil l'element en question a ete utilise : un i au de- 
but, indique que cet element est utilise pour la premiere fois a ce numero de ligne et un 
& au debut signifie qu'un sous-programme a ete appele ici. Les dereferences sont listees 
separement, c'est pourquoi figurent a la fois $0ptions et %$0ptions. 

B : : Deparse est un module offrant un affichage agreable (pretty printer) pouvant demys- 
tifier du code Perl et vous aidez a comprendre quelles transformations l'optimisateur a 
effectue sur votre code. Par exemple, ceci montre les valeurs utilisees par defaut par Perl 
pour diverses constructions : 

% perl -MO=Deparse -ne 'for (l .. 10) { print if -t }' 

LINE: while (def ined($_ = <ARGV>)) { 
foreach $_ (l .. 10) { 
print $_ if -t STDIN; 

} 

} 

L'option -p ajoute des parentheses pour que vous puissiez voir l'idee que Perl se fait de 
la preseance : 

% perl -M0=Deparse,-p -e 'print $a ** 3 + sqrt(2) / 10 ** -2 ** $c' 

print ((($a ** 3) + (1.4142135623731 / (10 ** (-(2 ** $c)))))); 

Vous pouvez utiliser -q pour voir en quelle operations elementaires les chaines interpo- 
lees sont compilees : 

% perl -M0=Deparse,-q -e '"Un $nom et quelques @ARGV\n"' 

'Un ' . $nom . ' et quelques ' . join($", @ARGV) . "\n"; 

Et ceci montre comment Perl compile vraiment une boucle for avec trois arguments en 
une boucle while : 

% perl -M0=Deparse,-x3 -e 'for ($i=0;$i<10;$i++) { $x++ }' 

$i = 0; 

while ($i < 10) { 
++$x; 

} 

continue { 
++$i 

} 

Vous pouvez mime appeler B: : Deparse sur un fichier de bytecode Perl produit par 
perkc -B et B : : Deparse le decompile alors pour vous. Cependant, lire des codes d'opera- 
tion Perl serialises est peut-etre un jeu d'enfant mais ce n'est pas le cas lorsqu'il s'agit 
d'un cryptage eleve. 

Compilateur d 'avant-garde, interpreteur retro 

II y a un temps pour penser a tout ; parfois ce temps est derriere nous et parfois il est 
devant. Parfois il se situe entre les deux. Perl ne pretend pas savoir quand penser, il offre 
done au programmeur un certain nombre d'options pour qu'il lui dise quand il faut 
penser. D'autres fois, il sait qu'une certaine sorte de pensee est necessaire mais il n'a 
aucune idee de ce qu'il doit penser, il a done besoin d'un moyen de le demander a votre 
programme. Votre programme repond a ce genre de questions en definissant des sous- 
programmes avec des noms appropries a ce que Perl essaie de trouver. 
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Non seulement le compilateur peut appeler l'interpreteur lorsqu'il veut avancer dans 
sa pensee mais l'interpreteur peut egalement appeler le compilateur en retour lorsqu'il 
veut reviser l'histoire. Votre programme peut utiliser plusieurs operateurs pour rappe- 
ler le compilateur. Comme le compilateur, l'interpreteur peut egalement appeler des 
sous-programmes nommes lorsqu'il veut se renseigner sur certaines choses. A cause de 
tous ces echanges entre le compilateur, l'interpreteur et votre programme, vous devez 
etre conscient des choses qui se passent et quand elles se passent. Nous parlerons tout 
d'abord du moment oil les sous-programmes nommes sont declenches. 

Au chapitre 10, Paquetages, nous avons vu comment un sous-programme AUTOLOAD d'un 
paquetage etait declenche lorsqu'une fonction indefinie dans ce paquetage etait appe- 
lee. Au chapitre 12, Objets, nous avons fait connaissance avec la methode DESTROY qui 
est invoquee lorsque la memoire occupee par un objet est sur le point d'etre recuperee 
par Perl. Enfin au chapitre 14, Variables liees, nous avons aborde plusieurs fonctions ap- 
pelees implicitement lorsqu'on accedait a une variable liee. 

Ces sous-programmes suivent tous la convention selon laquelle, si un sous-programme 
est declenche automatiquement par le compilateur ou l'interpreteur, nous ecrivons son 
nom en majuscules. Associes avec les differentes etapes de la vie de votre programme, il 
existe quatre autres sous-programmes de ce type, appeles BEGIN, CHECK, INIT et END. Le 
mot-cle sub est optionnel devant leurs declarations. Peut-etre devraient-ils etre plutot 
appeles « blocs » car d'une certaine maniere ils ressemblent plus a des blocs nommes 
qu'a de veritables sous-programmes. 

Par exemple, au contraire des sous-programmes ordinaires, il n'y a aucun mal a declarer 
ces blocs plusieurs fois, puisque Perl garde une trace du moment oil les appeler, vous 
n'avez done pas a les appeler par leur nom. (Ils se differencient egalement des sous-pro- 
grammes ordinaires en ce que shift et pop se comportent comme si vous etiez dans le 
programme principal et manipulent done @ARGV par defaut et non @_.) 

Ces quatre types de blocs s'executent dans cet ordre : 

BEGIN 

S'execute ASAP (as soon as parsed 9 ) a chaque fois qu'on les rencontre pendant la 
compilation et avant de compiler le reste du fichier. 

CHECK 

S'execute lorsque la compilation est achevee mais avant que le programme ne 
demarre. (CHECK peut vouloir dire « checkpoint » (point de controle) ou « double- 
check » (double verification) ou meme simplement « stop ».) 

INIT 

S'execute au debut de l'execution, juste avant que le flux principal de votre pro- 
gramme ne commence. 

END 

S'execute a la fin de l'execution, juste apres que le programme a fini. 



9. N.d.T. : des que parses, analyses, jeu de mot avec la signification habituelle d'ASAP : as soon as 
possible, des que possible. 
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Si vous declarez plus d'un de ces blocs avec le meme nom, mime dans des modules se- 
pares, les BEGIN s'executent tous avant les CHECK, qui eux-memes s'executent tous avant 
les I NIT, qui a leur tour s'executent tous avant les END — qui finalement sont les derniers 
a s'executer avant de mourir, apres que votre programme a fini. De multiples BEGIN et 
INIT s'executent dans l'ordre dans lequel ils ont ete declares (PIFO,first in, first out : pre- 
mier arrive, premier servi) et les CHECK et END s'executent dans l'ordre inverse dans le- 
quel ils ont ete declares (LIFO, last in, first out : dernier arrive, premier servi). 

Ceci est probablement plus clair avec une demonstration : 

#!/usr/bin/perl -1 

print "demarre l'execution principale ici\n"; 

die "l'execution principale meurt ici\n"; 

die "XXX: jamais atteintAn"; 

END { print "ler END: fini d'executer" } 

CHECK { print "ler CHECK: fini de compiler" } 

INIT { print "ler INIT: commence a executer" } 

END { print "2eme END: fini d'executer" } 

BEGIN { print "ler BEGIN: toujours en train de compiler" } 

INIT { print "2eme INIT: commence a executer" } 

BEGIN { print "2eme BEGIN: toujours en train de compiler" } 

CHECK { print "2eme CHECK: fini de compiler" } 

END { print "3eme END: fini d'executer" } 

Lorsqu'il s'execute, ce programme de demonstration affiche ceci : 

ler BEGIN: toujours en train de compiler 

2eme BEGIN: toujours en train de compiler 

2eme CHECK: fini de compiler 

ler CHECK: fini de compiler 

ler INIT: commence a executer 

2eme INIT: commence a executer 

demarre l'execution principale ici 

l'execution principale meurt ici 

3eme END: fini d'executer 

2eme END: fini d'executer 

ler END: fini d'executer 

Puisqu'un bloc BEGIN s'execute immediatement, il peut entrer dans les declarations, les 
definitions et les importations de sous-programmes avant meme que le reste du fichier 
ne soit compile. Ceci peut alterer la maniere dont le compilateur analyse le reste du fi- 
chier courant, tout particulierement si vous importez des definitions de sous-program- 
mes. Du moins, declarer un sous-programme lui permet d'etre utilise comme un 
operateur de liste, rendant les parentheses optionnelles. Si le sous-programme importe 
est declare avec un prototype, les appels a ce sous-programme peuvent etre analyses 
comme les fonctions internes et peuvent meme supplanter les fonctions internes du 
meme nom afin de leur donner une semantique differente. La declaration use n'est 
qu'un bloc BEGIN qui s'y croit. 

Les blocs END, par contraste, s'executent aussi tard que possible : lorsque votre program- 
me quitte l'interpreteur Perl, meme si c'est le resultat d'un die non intercepte ou d'une 
autre exception fatale. II existe deux situations dans lesquelles un bloc END (ou une me- 
thode DESTROY) est court-circuite. II ne s'execute pas si, au lieu de se terminer, le proces- 
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sus courant se metamorphose d'un programme a un autre via exec. Un processus balaye 
de la surface de la terre par un signal non intercepts court-circuite egalement ses routi- 
nes END. (Voir le pragma use sigtrap decrit au chapitre 31, Modules de pragmas, pour 
un moyen facile de convertir les signaux interceptables en exceptions. Pour des infor- 
mations generales sur les signaux, voir la section Signaux au chapitre 16, Communication 
inter-processus.) Pour eviter le traitement de tous les END, vous pouvez appeler P0- 
SIX: :_exit ou faire un kill -9, $$ ou simplement exec de n'importe quel program- 
me inoffensif, comme/im/frue sur les systemes Unix. 

A l'interieur d'un bloc END, $? contient le statut avec lequel le programme va sortir en 
faisant exit. Vous pouvez modifier $? depuis l'interieur du bloc END pour changer la 
valeur de sortie du programme. Faites attention au changement accidentel de $? en lan- 
cant un autre programme avec system ou des apostrophes inverses. 

Si vous avez plusieurs blocs END a l'interieur d'un fichier, ils s'executent dans l'ordre in- 
verse de leur definition. C'est-a-dire que le dernier bloc END defini est le premier a s'exe- 
cuter lorsque votre programme a fini. Cette inversion permet aux blocs BEGIN et END 
correspondants d'etre imbriques comme vous le souhaiteriez, si vous les aviez associes 
par paires. Par exemple, si le programme principal et un module qu'il charge ont leur 
propre paire de sous-programmes BEGIN et END, comme ceci : 

BEGIN { print "le programme principal a commence" } 
END { print "le programme principal a fini" } 
use Module; 

et dans ce module, vous avez ces declarations : 

BEGIN { print "le module a commence" } 
END { print "le module a fini" } 

alors le programme principal sait que son BEGIN arrivera toujours en premier et son END 
toujours en dernier. (Oui, BEGIN est vraiment un bloc a la compilation mais des argu- 
ments identiques s'appliquent a des paires de blocs INIT et END a l'execution.) Ce prin- 
cipe est vrai recursivement pour tout fichier qui en inclut un autre lorsque les deux ont 
des declarations comme celles-ci. Cette propriete d'imbrication implique que ces blocs 
fonctionnent bien en tant que constructeurs et destructeurs. Chaque module peut avoir 
ses propres fonctions d'initialisation et de demolition que Perl appellera automatique- 
ment. De cette maniere, le programmeur n'a pas a se se rappeler si une bibliotheque par- 
ticuliere est utilisee, ni quelle initialisation speciale ou quel code de nettoyage doit etre 
invoque, ni quand l'invoquer. Les declarations du module s'occupent de ces evene- 
ments. 

Si vous pensez a un eval CHAINE comme a un rappel (c'est-a-dire, un appel en arriere) du 
compilateur par l'interpreteur, alors vous pourriez penser a un BEGIN comme a un ap- 
pel en avant de l'interpreteur par le compilateur. Les deux suspendent temporairement 
l'activite et basculent le mode d'operation. Lorsque nous disons qu'un bloc BEGIN s'exe- 
cute aussi tot que possible, nous voulons dire qu'il s'execute des qu'il est completement 
defini, avant meme que le reste du fichier qui le contient ne soit analyse. Les blocs BEGIN 
sont par consequent executes a la compilation, jamais a l'execution. Une fois qu'un bloc 
BEGIN s'est execute, il devient immediatement indefini et le code qu'il a utilise est ren- 
voye a l'espace memoire de Perl. Vous ne pourriez pas appeler un bloc BEGIN comme 
un sous-programme meme si vous essayiez car a l'heure ou vous le feriez, il serait deja 
parti. 
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De meme que les blocs BEGIN, les blocs INIT s'executent juste avant que l'execution de 
Perl ne commence, dans un ordre FIFO (first in, first out : premier arrive, premier servi). 
Par exemple, les generateurs de codes documented dans perlcc utilisent des blocs INIT 
pour initialiser et resoudre les pointeurs vers les XSUB. Les blocs INIT sont vraiment 
comme les blocs BEGIN, sauf qu'ils permettent au programmeur de distinguer les cons- 
tructions qui se deroulent a la compilation de celles qui se produisent a l'execution. 
Lorsque vous lancez un script directement, ceci n'est pas extremement important car le 
compilateur est de toute facon invoque a chaque fois ; mais lorsque la compilation est 
separee de l'execution, la distinction peut devenir cruciale. Le compilateur peut n'etre 
invoque qu'une seule fois et l'executable resultant peut l'etre plusieurs fois. 

De meme que les blocs END, les blocs CHECK s'executent des que la phase de compilation 
de Perl se finit mais avant que la phase d'execution ne commence, dans un ordre LIFO 
(last in, first out : dernier arrive, premier servi). Les blocs CHECK sont utiles pour 
« liberer » le compilateur tout comme les blocs END sont utiles pour liberer votre pro- 
gramme. En particulier, les sorties (backends) utilisent toutes des blocs CHECK comme le 
point a partir duquel invoquer leurs generateurs de code respectifs. Tout ce qu'elles ont 
besoin de faire est de mettre un bloc CHECK dans leur propre module et il s'executera au 
moment approprie, vous n'avez done pas a installer de CHECK dans votre programme. 
Pour cette raison, vous n'ecrirez que tres rarement un bloc CHECK vous-meme, a moins 
que vous n'ecriviez de tels modules. 

Recapitulant tout ceci, le tableau 18-1 enumere les diverses constructions en detaillant 
le moment ou elles compilent le code represente par « . . . » et celui oil elles l'executent. 
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Bloc ou 

expression 


Compile 
pendant la 
phase de 


Capture les 
erreurs de 
compilation 


Execute 
pendant la 
phase de 


Capture les 

erreurs 

d'execution 


Politique de 

declenchement 

d'appel 


use ... 


C 


Non 


C 


Non 


Maintenant 


no . . . 


C 


Non 


C 


Non 


Maintenant 


BEGIN {...} 


C 


Non 


c 


Non 


Maintenant 


CHECK {...} 


C 


Non 


c 


Non 


Tard 


INIT {...} 


C 


Non 


E 


Non 


Tot 


END {...} 


C 


Non 


E 


Non 


Tard 


eval { . . .} 


C 


Non 


E 


Oui 


Indus (inline) 


eval " . . . " 


E 


Oui 


E 


Oui 


Indus (inline) 


truc(...) 


C 


Non 


E 


Non 


Indus (inline) 


sub true {. . . } 


C 


Non 


E 


Non 


Appel n'importe 
quand 


eval "sub {...}" 


E 


Oui 


E 


Non 


Appel plus tard 


s/motif/. . ./e 


C 


Non 


E 


Non 


Indus (inline) 


s/motif/" . . . "/ee 


E 


Oui 


E 


Oui 


Indus (inline) 



Maintenant que vous connaissez la partition, nous esperons que vous serez capable de 
composer et de jouer vos morceaux de Perl avec plus d'assurance. 




Vinterface de 



* la ligne de 
commande 



Ce chapitre montre comment faire pointer Perl dans la bonne direction avant d'ouvrir 
le feu avec. II existe diverses facon de faire viser Perl mais les deux moyens primaires 
sont par le biais d'options (switches) dans la ligne de commande et par le biais de varia- 
bles d'environnement. Les options sont le moyen le plus immediat et le plus precis 
d'ajuster une commande particuliere. Les variables d'environnement sont plus souvent 
employees pour mettre en place la politique globale. 



II est heureux que Perl se soit developpe dans le monde Unix, car cela signifie que sa 
syntaxe d'appel fonctionne assez bien sous les interpreteurs de commandes des autres 
systemes d'exploitation. La plupart des interpreteurs de commandes savent comment 
traiter une liste de mots en arguments, et ne voient pas d'inconvenient a ce qu'un argu- 
ment commence par un signe moins. Bien entendu, il existe cependant quelques cas oil 
vous vous faites pieger lorsque vous passez d'un systeme a Fautre. Vous ne pouvez pas 
utiliser les apostrophes sous MS-DOS comme vous le faites sous Unix, par exemple. Et 
sur les systemes comme VMS, il est necessaire d'employer un emballage logiciel (wrap- 
per) sautant a travers divers cerceaux pour emuler l'indirection des entrees/sorties 
d'Unix. Nous posons notre joker quant a Y interpretation des jokers (wildcards). Mais 
une fois ces problemes resolus, Perl traite ses options et ses arguments a peu pres de la 
meme maniere sur n'importe quel systeme d'exploitation. 

Meme lorsque vous ne disposez pas d'un interpreteur de commandes per se, il est assez 
facile d'executer un programme Perl depuis un autre programme, ecrit dans n'importe 
quel langage. Le programme appelant peut non seulement passer des arguments de la 
maniere traditionnelle, mais il peut egalement passer des informations via des variables 
d'environnement et, si votre systeme d'exploitation l'implemente, des descripteurs de 
fichiers herites (voir Passage de handles de fichiers au chapitre 16, Communication inter-pro- 
cessus). Meme des mecanismes de passage d'argument plus exotiques peuvent facile- 
ment etre encapsules dans un module, amenes ensuite dans votre programme Perl via 
une simple directive use. 
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Perl analyse les options de la ligne de commande de la maniere standard. C'est-a-dire 
qu'il s'attend a ce que les options (les mots commencant par un moins) viennent en pre- 
mier sur la ligne de commande. Le nom du script vient generalement ensuite, suivi par 
les arguments additionnels a passer au script. Certains de ces arguments supplementai- 
res peuvent eux-memes ressembler a des options, auquel cas ils doivent etre traites par 
le script car Perl abandonne l'analyse des options des qu'il voit une non-option, ou l'op- 
tion speciale « - - » qui vaut dire « Je suis la derniere option ». 

Perl vous procure une certaine souplesse en ce qui concerne ce que vous fournissez au 
programme. Pour les petites taches rapides et brouillonnes, vous pouvez programmer 
Perl entierement depuis la ligne de commande. Pour les travaux plus importants, plus 
permanents, vous pouvez fournir un script Perl dans un fichier separe. Perl recherche a 
compiler et a lancer un script que vous pouvez specifier avec Fune de ces trois manieres : 

1. Specifie ligne par ligne via des options -e sur la ligne de commande. Par exemple : 

% perl -e "print 'Salut, tout le monde.'" 

Salut, tout le monde. 

2. Contenu dans le fichier specifie par le premier nom de fichier sur la ligne de com- 
mande. Les systemes supportant la notation #! sur la premiere ligne d'un script 
executable invoquent les interpreteurs de cette facon a votre insu. 

3. Passe implicitement via l'entree standard. Cette methode ne fonctionne que s'il n'y 
a pas de noms de fichier en argument ; pour passer des arguments a un script en 
entree standard, vous devez utiliser la methode 2, specifier explicitement un « - » 
pour le nom du script. Par exemple : 

% echo "print qq(Salut, @ARGV.)" | perl - tout le monde 

Salut, tout le monde. 

Avec les methodes 2 et 3, Perl commence par analyser le fichier d'entree depuis le 
debut — a moins d'avoir specifie l'option -x, ce qui lui fait rechercher la premiere ligne 
commencant par # ! contenant le mot « perl », d'oii il demarre. Cela sert a lancer un 
script inclus dans un message plus grand. En ce cas, vous pourriez indiquer la fin du 
script par le token END . 

Que vous utilisiez ou non -x, la ligne #! est toujours examinee pour y trouver des op- 
tions au moment de l'analyse syntaxique de la ligne. Ainsi, si vous vous trouvez sur une 
plate-forme qui n'autorise qu'un argument sur la ligne #! ou pis, qui ne reconnait 
meme pas la ligne #! comme etant speciale, vous pouvez toujours conserver un com- 
portement coherent des options quelle que soit la maniere dont Perl est invoque, meme 
si -x a ete utilise pour trouver le debut du script. 

Attention : comme les versions plus anciennes d'Unix interrompent sans rien dire l'in- 
terpretation par le noyau de la ligne # ! apres 32 caracteres, certaines options peuvent 
traiter votre programme correctement ou non ; vous pourriez meme obtenir un « - » 
sans sa lettre, si vous n'etes pas prudent. Assurez-vous que tous vos scripts tombent avant 
ou apres cette limite de 32 caracteres. La plupart des options ne se soucient pas d'etre 
traitees plusieurs fois mais un « - » au lieu d'une option complete pousserait Perl a es- 
sayer de lire son code source depuis l'entree standard plutot que depuis votre script. Et 



1. En supposant que vous etes d'accord avec le fait qu'Unix soit standard et maniere. 
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une option - I tronquee pourrait egalement provoquer des resultats etranges. Toutefois, 
certaines options tiennent compte du fait qu'elles soient traitees deux fois, comme les 
combinaisons de -1 et de -0. Mettez toutes les options apres la limite de 32 caracteres 
(le cas echeant) ou remplacez l'emploi de -OCHIFFRES par BECIN{$/ = " \QCHIFFRES" ; }. 
Evidemment, si vous n'etes pas sur un systeme UNIX, vous etes sur de ne pas avoir ce 
genre de probleme. 

L'analyse des options sur la ligne # ! demarre apres que « perl » est mentionne pour la 
premiere fois. Les sequences « -* » et « - » sont specifiquement ignorees au benefice 
des utilisateurs d'emacs et, si vous vous en sentez l'envie, vous pouvez ecrire : 

#!/bin/sh -- # -*- perl -*- -p 
eval 'exec perl $0 -S 
if 0; 

et Perl ne verra que l'option -p. La jolie sequence « -*- perl -*- » indique a emacs de 
demarrer en mode Perl ; elle n'est pas necessaire si vous n'utilisez pas emacs. Le sale -S 
est explique plus loin dans la description de cette option. 

Une astuce identique met en jeu le programme eny(l), si vous en disposez : 

#!/usr/bin/env perl 

Les exemples precedents utilisent un chemin relatif jusqu'a l'interpreteur Perl, obte- 
nant ainsi la version trouvee en premier dans le chemin de l'utilisateur. Si vous voulez 
une version particuliere de Perl, ecrivez, perl5. 6 .1 et placez ceci directement dans le che- 
min de la ligne #!, soit avec le programme env, soit avec le sale -S, soit avec un traite- 
ment ordinaire de # ! . 

Si la ligne #! ne contient pas le mot « perl », le programme cite apres le #! est execute 
a la place de l'interpreteur Perl. Par exemple, supposons que vous ayez ici un script or- 
dinaire pour le Bourne shell qui dirait : 

#!/bin/sh 

echo "De suis un script shell" 

Si vous donnez ce fichier a Perl, celui-ci lancera /ki'n/sft pour vous. C'est un peu bizarre, 
mais cela facilite la vie a ceux dont les machines ne reconnaissent pas # ! , parce qu'ils 
peuvent — en positionnant leur variable d'environnement SHELL — indiquer a un pro- 
gramme (comme un gestionnaire de courrier) que leur shell est /usr/bin/perl et Perl en- 
verra le programme a l'interpreteur qui leur convient, meme si leur noyau est trop 
stupide pour le faire tout seul. 

Mais revenons aux scripts Perl qui sont vraiment des scripts Perl. Apres avoir localise vo- 
tre script, Perl compile le programme complet sous une forme interne (voir le chapitre 
18, Compilation). S'il y a une erreur de compilation, l'execution du script n'est meme pas 
lancee. (Au contraire du script shell typique ou du fichier de commande, qui pourrait 
s'executer partiellement avant de trouver une erreur de syntaxe.) Si le script est syntaxi- 
quement correct, il est execute. S'il arrive a la fin sans avoir rencontre un operateur exit 
ou die, un exit(o) implicite est fourni par Perl pour indiquer le succes de l'operation 
a celui qui vous appelait. (Au contraire du programme C typique, oil vous etes suscepti- 
ble d'obtenir un statut de sortie aleatoire si votre programme ne fait que se terminer de 
la maniere normale.) 
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#! et isolement (quotation) sur les systemes non-Unix 

La technique # ! , propre a Unix, peut etre simulee sur d'autres systemes : 
Macintosh 

Un programme Perl sur Macintosh aura la paire Type/Creator appropriee, de facon a 
ce qu'un double clic invoque l'application Perl. 

MS-DOS 

Creez un fichier batch pour lancer votre programme et codifiez-le dans 
ALTERNATIVE_SHEBANC. Voir le fichier dosish.h dans les sources de la distribution 
Perl pour plus d'informations a ce sujet. 

05/2 

Ajoutez cette ligne : 

extproc perl -S -vos_options 
en tant que premiere ligne des fichiers *.cmd (-S contourne un bogue dans la 
maniere dont cmd.exe gere « extproc »). 

VMS 

Mettez ces lignes : 

$ perl -mesopt 'f$env( "procedure")' 'pi' 'p2' 'p3' 'p4' 'p5' 'p6' 'p7' 
'p8' ! 

$ exit++ + ++$status != 0 and $exit = $status = undef; 
au debut de votre programme, oil -mesopt represente toutes les options de ligne de 
commande que vous voulez passer a Perl. Vous pouvez desormais invoquer le pro- 
gramme directement en tapant perl programme, en tant que procedure DCL en 
disant ^programme ou implicitement via DCL$PATH en utilisant juste le nom du pro- 
gramme. Cette incantation est un peu difficile a memoriser mais Perl l'affichera 
pour vous si vous tapez perl "-V: startperl". Si vous n'arrivez pas a vous souvenir 
de ca — he bien, c'est la raison pour laquelle vous avez achete ce livre. 

Win?? 

Lorsque vous utilisez la distribution ActiveState de Perl, sous certaines variantes de 
la suite de systemes d'exploitation Windows de Microsoft (c'est-a-dire, Win95, 
Win98, WinOO, 2 WinNT, mais pas Win3.1), la procedure d'installation de Perl 
modifie la base de registre de Windows pour associer l'extension .pi avec l'interpre- 
teur Perl. 

Si vous installez un autre portage de Perl, y compris celui du repertoire Win32 de la 
distribution de Perl, vous devrez alors modifier vous-meme la base de registre de 
Windows. 

Remarquez que l'utilisation d'une extension .pi implique que vous ne pourrez plus 
faire la difference entre un programme executable Perl et un fichier de bibliothe- 
que Perl (« perl library »). Vous pourriez plutot utiliser .plx pour un programme 
Perl afin d'eviter ceci. Ce n'est plus tres ennuyeux aujourd'hui que la plupart des 
modules Perl se trouvent dans des fichiers .pm. 



2. Heu, veuillez excuser ces problemes techniques... 
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Les interpreteurs de commandes les systemes non-Unix ont des idees extraordinaire- 
ment differentes des shells Unix concernant l'isolement (quoting). II vous faudra appren- 
dre quels sont les caracteres speciaux de votre interpreteur de commandes (on trouve 
couramment *, \ et ") et comment proteger les espaces et ces caracteres speciaux pour 
lancer des scripts sur une seule ligne (one-liners) via l'option -e. Vous pourriez egale- 
ment avoir a changer un seul % en %% ou le proteger avec une sequence d'echappement, 
s'il s'agit d'un caractere special pour votre shell. 

Sur certains systemes, vous devrez peut-etre changer les apostrophes en guillemets. Mais 
ne faites pas cela sur les systemes Unix ou Plan9 ou n'importe quel systeme oil tourne 
un shell a la Unix, comme les systemes du MKS Toolkit ou du paquetage Cygwin pro- 
duit par les gens de chez Cygnus, appartenant maintenant a Redhat. Le nouvel emula- 
teur d'Unix, Interix, produit par Microsoft, commence egalement a devenir, hum, hum, 
interixant. 

Par exemple, sur Unix et Mac OS X, utilisez : 

% perl -e 'print "Salut tout le mondeV" 
Sur Macintosh (avant MAC OS X), utilisez : 

print "Salut tout le mondeV 
puis lancez « Mon_script » ou Shift-Command-R. 
Sur VMS, utilisez : 

$ perl -e "print ""Salut tout le mondeV 
ou encore, avec qq/7 : 

$ perl -e "print qq(Salut tout le monde\n)" 
Et sur MS-DOS, etc., utilisez : 

A:> perl -e "print V'Salut tout le monde\n\"" 
ou utilisez qq/7 pour choisir vos propre caracteres d'isolement : 

A:> perl -e "print qq(Salut tout le monde\n)" 

Le probleme est qu'aucun de ces exemples n'est fiable : cela depend de l'interpreteur de 
commandes que vous utilisez. Si le shell etait 4DOS, ceci fonctionnerait probablement 
mieux : 

perl -e "print <Ctrl-x>"Salut tout le monde\n<Ctrl-x>"" 

Le programme CMD.EXE dans Windows NT semble avoir recupere beaucoup de fonc- 
tionnalites du shell standard Unix lorsque tout le monde avait le dos tourne mais es- 
sayez de trouver de la documentation sur ses regies concernant l'isolement (quoting 
rules) ! 

Sur Macintosh, 3 tout ceci depend de l'environnement que vous utilisez. MPW, qui peut 
etre utilise comme un shell pour MacPerl, est tres proche des shells Unix pour son sup- 
port de differentes variantes d'isolement, si ce n'est qu'il utilise allegrement les caracte- 
res non ASCII de Macintosh comme caracteres de controle. 



3. Du moins, sur les versions anterieures a Mac OS X, qui, de maniere assez heureuse, est un sys- 
teme derive de BSD. 
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II n'y a pas de solution generale a tout ceci. C'est tout bonnement une belle pagaille. Si 
vous n'etes pas sur un systeme Unix mais que vous voulez faire des choses avec la ligne 
de commande, vous avez plus vite fait d'acquerir un meilleur interpreteur de comman- 
des que celui que votre constructeur vous a fourni, ce qui ne devrait pas poser trop de 
difficultes. 

Ou ecrivez le tout en Perl et oubliez les scripts sur une seule ligne. 

Emplacement de Perl 

Bien que cela puisse paraitre evident, Perl n'est utile que lorsque les utilisateurs peuvent 
facilement le trouver. Autant que possible, il est bon d'avoir a la fois /usr/bin/perl et/usr/ 
localft>in/perl comme liens symboliques vers le veritable binaire. Si cela n'est pas possi- 
ble, les administrateurs systeme sont fortement encourages a mettre Perl et les utilitaires 
associes dans un repertoire generalement present dans le PATH standard d'un utilisateur 
ou dans un quelconque autre endroit qui soit evident et pratique. 

Dans ce livre, nous utilisons la notation standard # ! /usr/bin/perl sur la premiere ligne 
d'un programme, pour designer le mecanisme fonctionnant sur votre systeme, quel 
qu'il soit. Si vous avez besoin de lancer une version particuliere de Perl, utilisez un che- 
min specifique : 

#!/usr/local/bin/perl5.6.0 

Si vous voulez juste utiliser une version au moins egale a un certain numero de version 
mais que vous vous fichez des versions superieures, placez une instruction telle que cel- 
le-ci vers le debut de votre programme : 

use V5.6.0; 

(Remarque : les versions plus anciennes de Perl utilisaient des numeros comme 5.005 
ou 5.004_05. De nos jours, nous les verrions plutot comme 5.5.0 et 5.4.5 mais les ver- 
sions de Perl anterieures a 5.6.0 ne comprendraient pas cette notation.) 

Options 

Une option de la ligne de commande ne comportant qu'un seul caractere sans son argu- 
ment peut toujours etre combinee (reliee) avec l'option suivante. 

#!/usr/bin/perl -spi.bak # comme -s -p -i.bak 

Les options sont egalement appelees des flags ou des drapeaux ou des switchs (au singu- 
lier switch). Peu importe le nom que vous leur donnez, voici celles que Perl reconnait : 

Termine le traitement des options, meme si l'argument suivant commence par un 
moins. II n'a aucun autre effet. 

-0NUM_0CT 
-0 

Specifie le separateur d'enregistrements ($/) comme etant un nombre octal. Si 
NUM_0CT n'est pas present, le separateur est le caractere nul (c'est-a-dire le caractere 
0, soit "\0" en Perl). D'autres options peuvent preceder ou suivre le nombre octal. 
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Par exemple, si vous disposez d'une version de/;nd(l) pouvant afficher les noms de 
fichier termines par le caractere nul, vous pouvez ecrire ceci : 

% find . -name '*.bak' -printo | perl -nOe unlink 
La valeur speciale 00 fait que Perl lira les fichiers en mode paragraphe, ce qui est 
equivalent a positionner la variable $/ a "". La valeur 0777 fait que Perl gobera des 
fichiers entiers d'un seul coup. Cela revient a indefinir la variable $/. Nous 
employons 0777 puisqu'il n'existe pas de caractere ASCII de cette valeur. (Malheu- 
reusement, il existe un caractere Unicode de cette valeur, \N{ LATIN SMALL LETTER 0 
WITH STROKE AND ACUTE}, mais quelque chose nous dit que vous ne Futiliserez pas 
comme separateur pour vos enregistrements.) 

-a 

Active le mode autosplit mais seulement lorsque cette option est utilisee avec un -n 
ou un -p. Une commande split implicite est d'abord executee sur le tableau @F 
dans la boucle while implicite produite par le -n ou le -p. Ainsi : 

% perl -ane 'print pop(@F), "\n'V 
est equivalent a : 

while (<>) { 

@f = spiitc 

print pop(@F), "\n"; 

} 

Un separateur de champ different peut etre specifie en passant une expression regu- 
liere pour split a l'option -F. Par exemple, ces deux appels sont equivalents : 
% awk -F: J $7 && $7 !~ / A \/bin/' /etc/passwd 

% perl -F: -lane 'print if $F[6] && $F[6] !~ m( A /bin)' /etc/passwd 

-c 

Fait verifier par Perl la syntaxe du script avant de sortir sans executer ce qu'il vient 
de compiler. Techniquement, Perl en fera un peu plus que ca : il executera tous les 
blocs BEGIN ou CHECK et toutes les directives use, puisque ceux-ci sont censes se pro- 
duire avant l'execution du programme. Cependant, les blocs END ou INIT ne sont 
plus executes. L'ancien comportement, toutefois rarement utile, peut toujours etre 
obtenu en mettant : 

BEGIN { $ A C = 0; exit; } 
a la fin de votre script principal. 

-C 

Active l'utilisation par Perl des API de caracteres larges (wide-character) sur le sys- 
teme cible, si elles sont implementees (avec la version 5.6.0, cela ne fonctionne que 
sur les plates-formes Microsoft). La variable speciale ${ A WIDE_SYSTEM_CALLS} 
ref lete l'etat de cette option. 

-d 

Lance le script sous le debogueur Perl. Voir le chapitre 20, Le debogueur Perl. 
-A: MODULE 

Lance le script sous le controle d'un module de debogage ou de tracage installe 
dans la bibliotheque Perl sous le nom de Devel: -.MODULE. Par exemple, -d:DProf 
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execute le script avec le profileur Devel: :DProf. Voir egalement le paragraphe sur 
le debogage au chapitre 20. 

-DLETTRES 
-DNOMBRE 

Active les drapeaux de debogage. (Ceci ne fonctionne que si le debogage est com- 
pile dans votre Perl, comme decrit ci-dessous.) Vous pouvez specifier soit un NOMBRE 
valant la somme des bits desires, soit une liste de LETTRES. Pour voir comment il 
execute votre script, employez, par exemple, -D14 ou -Dslt. Une autre valeur utile 
est -D1024 ou -Dx, qui liste l'arbre syntaxique compile. Et -D512 ou -Dr affiche les 
expressions regulieres compilees. La valeur numerique est disponible en interne 
grace a la variable speciale $ A D. Le tableau 19-1 liste les valeurs de bits assignees : 



Tableau 19-1. Options de -D 



Bit 


Lettre 


Signification 


1 


P 




2 


s 


Instantanes de la pile. 


4 


1 


Traitement de la pile d'etiquettes. 


8 


t 


Trace de l'execution. 


16 


0 


Resolution des methodes et des surcharges. 


32 


C 


Conversions chaines/numerique. 


64 


P 


Affichage des commandes de preprocesseur pour -R 


128 


m 


Allocation memoire. 


256 


f 


Traitements des formats. 


512 


r 


Analyse et execution d'expressions regulieres. 


1024 


X 


Vidage memoire (dump) de l'arbre syntaxique. 


2048 


u 


Verification du marquage. 


4096 


L 


Fuites de memoire (necessite de compiler Perl avec -DLEAKTEST). 


8192 


H 


Vidage memoire (dump) de hachage — usurpe valuesQ. 


16384 


X 


Allocation de memoires de travail (scratchpad). 


32768 


D 


Nettoyage. 


65536 


S 


Synchronisation de threads. 



Tous ces drapeaux exigent un executable Perl ayant ete specialement compile pour 
le debogage. Toutefois, comme ce n'est pas le cas par defaut, vous serez incapable 
d'utiliser l'option -D sauf si votre administrateur systeme ou vous-meme avez com- 
pile cette version speciale de Perl pour le debogage. Voir le fichier INSTALL dans le 
repertoire des sources de Perl pour plus de details mais, pour resumer, vous devez 
passer -DDEBUGGINC a votre compilateur C lorsque vous compilez Perl lui-meme. Ce 
drapeau est automatiquement positionne si vous incluez l'option -g lorsque Confi- 
gure vous pose des questions a propos des drapeaux de l'optimisateur et du debo- 
gueur. 

Si vous essayez seulement d'obtenir une impression de chaque ligne de code Perl 
au fur et a mesure qu'il s'execute (de la meme maniere que sh -x le fait pour les 
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scripts shell), vous ne ne pouvez pas utiliser l'option -D de Perl. A la place, faites 
ceci : 

# Syntaxe du Bourne shell 

$ PERLDB_OPTS="NonStop=l AutoTrace=l frame=2" perl -dS programme 

# Syntaxe de csh 

% (setenv PERLDBOPTS "NonStop=l AutoTrace=l frame=2"; perl -dS 
programme) 

Voir le chapitre 20 pour les details et d'autres possibilites. 
-e C0DE_PERL 

Peut etre utilise pour entrer une ou plusieurs lignes de script. Si -e est utilise, Perl 
ne cherchera pas le nom du programme dans la liste d'arguments. L'argument 
C0DE_PERL est traite comme s'il se terminait par un saut de ligne, ainsi, plusieurs 
commandes -e peuvent etre donnees pour former un programme de plusieurs 
lignes. (Assurez-vous de mettre des points-virgules comme vous le feriez dans un 
programme normal stocke dans un fichier.) Ce n'est pas parce que -e fournit un 
saut de ligne a chaque argument que vous devez utiliser plusieurs options -e ; si 
votre shell autorise Fisolement (quoting) sur plusieurs lignes, comme sh, ksh ou 
bash, vous pouvez alors passer un script sur plusieurs lignes comme un seul argu- 
ment de -e : 

$ perl -e 'print "Salut, "j 

print "@ARGV !\n"j' la compagnie 

Salut, la compagnie ! 

Avec csh, il vaut probablement mieux utiliser plusieurs options -e : 
% perl -e 'print "Salut, ";' \ 

-e 'print "(3ARGV !\n"j' la compagnie 

Salut, la compagnie ! 
Les sauts de ligne, qu'ils soient implicites ou explicites, sont pris en compte dans la 
numerotation des lignes, ainsi, le second print se trouve a la ligne 2 du script de -e, 
dans les deux cas. 

-PM0TIF 

Specifie le motif selon lequel s'effectue l'eclatement (split) lorsque le mode autosplit 
est active via l'option -a (sinon, n'a aucun effet). Le motif peut etre entoure par des 
slash (//), des guillemets ("") ou des apostrophes ("). Si ce n'est pas le cas, il sera 
automatiquement mis entre apostrophes. Souvenez-vous que pour passer des apos- 
trophes ou des guillemets d'isolement via un shell, vous devrez isoler ces apostro- 
phes et la maniere dont vous pouvez le faire depend du shell. 

-h 

Affiche un resume des options de ligne de commande de Perl. 

-iEXTENSION 
-i 

Specifie que les fichiers traites par la construction <> doivent etre edites sur place. 
Ceci est realise en renommant le fichier d'entree, en ouvrant le fichier de sortie 
d'apres le nom d'origine et en selectionnant ce fichier de sortie comme fichier par 
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defaut pour les appels a print, printf et write. 4 

^EXTENSION est utilisee pour modifier le nom de l'ancien fichier afin d'en faire une 
copie de sauvegarde. Si aucune EXTENSION n'est fournie, aucune sauvegarde n'est 
effectuee et le fichier actuel est ecrase. Si YEXTENSION ne contient pas de *, la chaine 
est alors ajoutee a la fin du nom de fichier actuel. Si YEXTENSION contient un ou 
plusieurs caracteres *, chaque * est alors remplace par le nom du fichier actuelle- 
ment en cours de traitement. En termes de Perl, vous pourriez penser a ceci 
comme : 

($sauvegarde = $extension) =~ s/\*/$nom_f ichier/g; 
Ceci vous permet d'utiliser un prefixe pour le fichier de sauvegarde, au lieu — ou 
meme en complement — d'un suffixe : 

% perl -pi'orig_*' -e 's/truc/machin/' xyz # sauvegarde dans 'origxyz' 
Vous pouvez meme mettre les copies de sauvegarde des fichiers originaux dans un 
autre repertoire (a condition que le repertoire existe deja) : 

% perl -pi'ancien/*.orig' -e 's/truc/machin/' xyz # sauvegarde dans 

'ancien/xyz.orig' 
Les scripts sur une seule ligne sont equivalents dans chaque paire : 

% perl -pi -e 's/truc/machin/' xyz # ecrase le fichier actuel 

% perl -pi'*' -e 's/truc/machin/' xyz # ecrase le fichier actuel 

% perl -pi'.orig' -e 's/truc/machin/' xyz # sauvegarde dans 'xyz.orig' 
% perl -pi'*.orig' -e 's/truc/machin/' xyz # sauvegarde dans 'xyz.orig' 
Depuis le shell, ecrire : 

% perl -p -i.orig -e "s/truc/machin/;" 

revient au meme que d'utiliser le programme : 
#!/usr/bin/perl -pi.orig s/truc/machin/; 
Ce qui est un raccourci pratique pour le programme eminemment plus long : 
#!/usr/bin/perl 
$extension = '.orig'; 
LIGNE: while (<>) { 

if ($ARGV ne $ancien_argv) { 
if ($extension !~ A*/) { 

$sauvegarde = $ARGV . $extension; 

} 

else { 

($sauvegarde = $extension) =~ s/\*/$ARGV/g; 

} 

unless (rename($ARGV, $sauvegarde)) { 

warn "impossible de renommer $ARGV en $sauvegarde : $!\n"; 

close ARGV; 

next; 

} 

open(ARGV_SORTIE, ">$ARGV"); 



4. Techniquement, il ne s'agit pas vraiment d'un edition « sur place ». II s'agit du meme nom 
de fichier, mais d'un fichier physique different. 
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select (ARGV_SORTIE); 
$ancien_argv = $ARGV; 

} 

s/truc/machin/; 

} 

continue { 

print; # ceci ecrit dans le fichier de nom original 

} 

select(STDOUT); 

Ce code un peu long est virtuellement identique au simple code sur une seule ligne 
avec l'option -i, hormis le fait que la forme -i n'a pas besoin de comparer $ARGV a 
$ancien_argv pour savoir quand le nom de fichier a change. Mais elle utilise bien 
ARGV_SORTIE pour le handle de fichier selectionne et restaure, apres la boucle, 
Fancien STDOUT comme handle de fichier de sortie par defaut. Comme le code ci- 
dessus, Perl cree le fichier de sauvegarde sans tenir compte du fait que la sortie ait 
reellement change ou non. Voir la description de la fonction eof sans parentheses 
pour des exemples sur la maniere de detecter la fin de chaque fichier d'entree, au 
cas oil vous voudriez aj outer des lignes a chaque fichier ou remettre a zero la nume- 
rotation des lignes. 

Si, pour un fichier donne, Perl est incapable de creer le fichier de sauvegarde 
comme Y EXTENSION le specifie, il emettra un avertissement a cet effet et continuera 
a traiter les autres fichiers. 

Vous ne pouvez pas utiliser -i pour creer des repertoires ou pour enlever des exten- 
sions a des fichiers. Vous ne pouvez pas non plus l'utiliser avec un ~ indiquant le 
repertoire maison (home directory) — ce qui est d'autant mieux car certaines person- 
nes aiment utiliser ce caractere pour leurs fichiers de sauvegarde : 

% perl -pi~ -e 's/truc/machin/'' fichierl fichier2 fichier3... 
Enfin, l'option -i n'arrete pas l'execution de Perl si aucun nom de fichier n'est 
donne sur la ligne de commande. Lorsque cela arrive, aucune sauvegarde n'est 
effectuee puisqu'on ne peut pas determiner quel est le fichier original et le traite- 
ment s'applique de STDIN vers STDOUT comme on pouvait s'y attendre. 

-IREPERTOIRE 

Les repertoires specifies par -I sont ajoutes au debut de @INC, qui contient le che- 
min de recherche des modules. -I dit aussi au preprocesseur ou il faut chercher les 
fichiers d'inclusion. Le preprocesseur C est invoque par -P ; il recherche par defaut 
dans /usr/include et /usr/lib/perl. A moins que vous ne soyez sur le point d'utiliser le 
preprocesseur C (ce que quasiment plus personne ne fait), vous feriez mieux d'utili- 
ser la directive use lib dans votre script. Cependant, comme use lib, l'option -I 
ajoute implicitement les repertoires specif iques a la plate-forme. Voir use lib au 
chapitre 31, Modules de pragmas pour plus de details. 

-\NUM_OCT 
-1 

Active le traitement de fin de ligne automatique. Son effet est double : premiere- 
ment, il fait automatiquement un chomp sur la terminaison de ligne quand il est 
employe avec -n ou -p et deuxiemement, il positionne $\ a la valeur de NUM_OCT 
afin que toute instruction d'affichage ajoute un terminateur de ligne de valeur 
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ASCII NUM_OCT. Si NUM_OCT est omis, -1 positionne $\ a la valeur actuelle de $/, 
generalement un saut de ligne. Par exemple, pour couper les lignes a quatre-vingt 
colonnes, ecrivez ceci : 

% perl -lpe 'substr($_, 80) = ""' 
Remarquez que l'affectation $\ = $/ est faite lorsque l'option est traitee, le separa- 
teur d'enregistrements d'entree peut done etre different de celui de sortie si 
l'option -1 est suivie d'une option -0 : 

% gnufind / -printo | perl -InOe 'print "trouve $_" if -p' 
Cela positionne $\ a la valeur saut de ligne, puis $/ au caractere nul. (Remarquez 
que 0 aurait ete interprets comme faisant partie de l'option -1 s'il avait suivi imme- 
diatement le -1. C'est pourquoi nous avons insere l'option -n entre les deux.) 

-m et -M 

Ces options chargent un MODULE comme si vous aviez execute un use, a moins que 
vous n'ayez specific -MODULE au lieu de MODULE, auquel cas no est invoque. Par exem- 
ple, -Mstrict est identique a use strict, alors que -M-strict est identique a no 
strict. 

-mMODULE 

Execute use M0DULE{ ) avant d'executer votre script. 

-MODULE 

-W MODULE...' 

Execute use MODULE avant d'executer votre script. La commande est formee par 
simple interpolation du reste de l'argument suivant le -M, vous pouvez done iso- 
ler l'argument par des apostrophes pour ajouter du code supplemental apres 
le nom du module, par exemple, -M* module qw(truc machin)'. 

-mODULE=aigl,arg2.. . 

Un peu de sucre de syntaxe vous permet d'ecrire egalement -Mmod- 
ule=truc,machin comme raccourci pour -M'module qw(truc machin)'. Cette 
possibility dispense des apostrophes lorsqu'on importe des symboles. Le code 
reellement genere par -Mmodule=truc,machin est : 

use module split(/,/, q{truc,machin}) 
Remarquez que la forme avec = elimine la distinction entre -m et -M, mais il vaut 
mieux utiliser la forme en majuscules pour eviter toute confusion. 

Vous ne pouvez utiliser les options -M et -m que depuis une veritable invocation de 

Perl depuis la ligne de commande, non comme des options trouvees sur la ligne #! . 

(He, si vous alliez le mettre dans un fichier, pourquoi ne pas simplement ecrire a la 

place le use ou le no equivalent?) 

-n 

Pousse Perl a se comporter comme si la boucle suivante encadrait le script, ce qui le 
fait iterer sur les noms de fichiers en argument a la maniere de sed -n ou de awk : 
LINE: 

while (<>) { 

# le script vient ici 

} 
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Vous pouvez utiliser LINE (LIGNE en anglais) comme une etiquette de boucle depuis 
Finterieur de votre script, meme si vous ne pouvez pas voir la veritable etiquette 
dans votre fichier. 

Remarquez que les lignes ne sont pas affichees par defaut. Voir -p pour ce faire. 
Voici un moyen efficace de detruire tous les fichiers datant de plus d'une semaine : 

find . -mtime +7 -print | perl -nle 'unlink;' 
Cette operation est plus rapide que l'option -exec de find(l) car vous n'avez pas a lan- 
cer un processus a chaque nom de fichier trouve. Par une coincidence stupefiante, 
les blocs BEGIN et END peuvent etre utilises pour prendre le controle avant ou apres 
la boucle implicite, exactement comme dans aivk. 

Pousse Perl a se comporter comme si la boucle suivante encadrait le script, ce qui le 
fait iterer sur les noms de fichier en argument a la maniere de sed : 
LINE: 

while (<>) { 

# le script vient ici 

} 

continue { 

print or die "-p destination: $!\n"; 

} 

Vous pouvez utiliser LINE {LIGNE en anglais) comme etiquette de boucle depuis 
Finterieur de votre script, meme si vous ne pouvez pas voir la veritable etiquette 
dans votre fichier. 

Si un fichier designe par un argument ne peut pas etre ouvert pour une raison ou 
pour une autre, Perl vous en avertit et passe au fichier suivant. Remarquez que les 
lignes sont affichees automatiquement. Toujours par une coincidence stupefiante, 
les blocs BEGIN et END peuvent etre utilises pour prendre le controle avant ou apres 
la boucle implicite, exactement comme dans awk. 

Pousse votre script a passer par le preprocesseur C avant la compilation par Perl. 
(Comme les commentaires et les directives de cpp(l) commencent tous par le carac- 
tere #, il vaut mieux eviter de commencer les commentaires par des mots-cles du 
preprocesseur C comme « if », « else » ou « define ».) Que vous utilisiez l'option 
-P ou non, Perl accorde toujours de l'attention aux directives #line pour controler 
le numero de ligne et le nom de fichier, n'importe quel preprocesseur peut done 
informer Perl sur de telles choses. Voir la section Generer du Perl dans d'autres langa- 
ges au chapitre 24, Techniques couramment employees. 

Permet une analyse rudimentaire de la ligne de commande afin de rechercher les 
options suivant le nom du script, mais precedant tout nom de fichier ou une termi- 
naison d'options --. Toute option trouvee est eliminee de @ARGV et une variable du 
meme nom que l'option est positionnee dans Perl. Aucun accolement d'options 
n'est permis car les options de plusieurs caracteres sont autorisees. 
Le script suivant affiche « vrai » si, et seulement si, le script est invoque avec une 
option -true. 
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#! /usr/bin/perl -s 

if ($truc) { print "vrai\n"; } 

Si l'option est de la forme -xxx=yyy, la variable $xxx est positionnee a ce qui suit ce 
signe egal dans Fargument (« yyy » en Foccurrence). Le script suivant affiche 
« vrai » si et seulement si le script est invoque avec une option -truc=machin. 
#!/usr/bin/perl -s 

if ($truc eq 'machin') { print "vrai\n"; } 

Pousse Perl a utiliser la variable d'environnement PATH pour rechercher le script (a 
moins que le nom du script ne contienne des separateurs de repertoires). 
Generalement, cette option est utilisee pour emuler le demarrage par # ! sur les pla- 
tes-formes qui ne l'implementent pas. Sur de nombreuses plates-formes disposant 
d'un shell compatible avec le Bourne Shell ou le C shell, vous pouvez utiliser ceci : 
#! /usr/bin/perl 

eval "exec /usr/bin/perl -S $0 $*" 
if $lance_sous_un_shellj 
Le systeme ignore la premiere ligne et donne le script k/bin/sh, qui essaye d'execu- 
ter le script Perl comme un shell script. Le shell execute la seconde ligne comme 
une commande shell normale et demarre done Finterpreteur Perl. Sur certains sys- 
temes, $0 ne contient pas toujours le nom de chemin complet et le -S indique alors 
a Perl de rechercher le script si necessaire. Apres que Perl Fa trouve, il analyse les 
lignes et les ignore car la variable $lance_sous_un_shell n'est jamais vraie. 
${l+"$@"} vaudrait mieux que $* mais cette expression ne fonctionne pas si le 
script est interprete par csh. Afin de lancer sh au lieu de csh, certains systemes doi- 
vent remplacer la ligne # ! par une ligne ne contenant qu'un deux-points, qui sera 
poliment ignore par Perl. D'autres systemes ne peuvent controler cela et ont besoin 
d'un montage totalement deviant pouvant fonctionner sous csh, sh ou perl, comme 
ce qui suit : 

eval '(exit $?0)' && eval 'exec /usr/bin/perl -S $0 ${l+"$@"}' 
& eval 'exec /usr/bin/perl -S $0 $argv:q' 
if 0; 

Oui. C'est laid, tout autant que les systemes qui fonctionnent 5 ainsi. 
Sur certaines plates-formes, l'option -S pousse egalement Perl a ajouter des suffixes 
au nom de fichier pendant qu'il le recherche. Par exemple, sur les plates-formes 
Win32, les suffixes .bat et .cmd sont ajoutes si la recherche du fichier original 
echoue et que le nom ne se termine pas deja par Fun de ces deux suffixes. Si votre 
version de Perl a ete construite avec le debogage active, vous pouvez utiliser 
l'option -Dp de Perl pour suivre la progression de la recherche. 
Si le nom de fichier fourni contient des separateurs de repertoires (meme simple- 
ment en tant que nom de chemin relatif, et non un chemin absolu) et si le fichier 
n'est pas trouve, les plates-formes ajoutant implicitement des extensions de fichiers 
(non Unix) le feront et chercheront le fichier avec l'ajout de ces extensions, Fune 
apres Fautre. 



5. Nous utilisons le terme en connaissance de cause. 



Traitement des commandes 



469 



Sur les plates-formes comme DOS, si le script ne contient pas de separateur de 
repertoires, il sera tout d'abord recherche dans le repertoire actuel avant de l'etre 
dans le PATH. Sur les plates-formes Unix, le script sera recherche strictement dans 
PATH, a cause des problemes de securite engendres par l'execution accidentelle de 
quelque chose dans le repertoire de travail courant sans en faire explicitement la 
demande. 

-T 

Force l'activation des verifications « de marquage » afin que vous puissiez les tester. 
Ces verifications ne sont generalement lancees qu'en executant en setuid ou setgid. 
II vaut mieux les activer explicitement pour les programmes qui tournent sous le 
nom de quelqu'un d'autre, comme les programmes CGI. Voir le chapitre 23, Secu- 
rite. 

Remarquez que, pour des raisons de securite, Perl doit voir cette option assez tot ; 
cela signifie habituellement qu'elle doit se trouver au debut de la ligne de com- 
mande ou de la ligne #! . Si elle n'est pas trouvee assez tot, Perl s'en plaint. 

-u 

Provoque un core dump de Perl apres avoir compile le script. Vous pouvez alors, en 
theorie, prendre ce core dump et le transformer en fichier executable grace au pro- 
gramme undump (qui n'est pas fourni). Le demarrage est ainsi accelere au detriment 
de Fespace disque (que vous pouvez minimiser en faisant strip sur l'executable). Si 
vous voulez executer une partie du script avant le vidage, utilisez plutot l'operateur 
dump de Perl. Remarque : la disponibilite de undump depend des plates-formes ; il 
peut ne pas exister pour certains portages de Perl. II a ete remplace par le nouveau 
generateur de code Perl-vers-C, qui est bien plus portable (mais toujours experi- 
mental). 

-U 

Permet a Perl d'effectuer des operations dangereuses. Actuellement, les seules ope- 
rations « dangereuses » sont la suppression de repertoires en tant que super-utilisa- 
teur et le lancement de programmes en setuid alors que les verifications fatales de 
marquage sont transformers en avertissements. Remarquez que les avertissements 
doivent etre actives pour engendrer les avertissements de verifications de mar- 
quage. 

-v 

Affiche la version et le niveau de correctif (patch level) de votre executable Perl, 
ainsi que quelques informations supplementaires. 

-V 

Affiche un resume des principales valeurs de configuration de Perl et la valeur 
actuelle de @INC. 

-y-.NOM 

Affiche sur STDOUT la valeur de la variable de configuration indiquee. Le NOM peut 
contenir des caracteres d'expressions regulieres, comme « . » pour correspondre a 
n'importe quel caractere ou « . * » pour correspondre a toute sequence de caracte- 
res optionnelle. 
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% perl -V:man.dir 

manldir=''/usr/local/man/manl'' 
man3dir=''/usr/local/man/man3' 

% perl -V: '. threads' 

d_oldpthreads='undef ' 
use5005threads='' define' 
useithreads^undef 
usethreads^ define' 

Si vous demandez une variable de configuration qui n'existe pas, sa valeur sera rap- 
portee comme « UNKNOWN » (INCONNUE). Les informations de configuration sont 
accessibles depuis l'interieur d'un programme en utilisant le module Conf ig, bien 
que les motifs ne soit pas implemented pour les indices des hachages : 

% perl -MConfig -le ' print $Conf ig{manldir} J 

/usr/local/man/manl 
Voir le module Conf ig au chapitre 32, Modules standard. 

-w 

Affiche des messages d'avertissement concernant les variables qui ne sont mention- 
nees qu'une fois et sur les valeurs scalaires qui sont utilisees avant d'etre position- 
nees. Previent egalement des redefinitions de sous-programme et des references a 
des handles de fichier indefinis ou de ceux, ouverts en lecture seule, sur lesquels 
vous essayez d'ecrire. Avertit egalement si vous utilisez des valeurs en tant que 
nombres alors qu'elles ne semblent pas numeriques ou si vous utilisez un tableau 
comme s'il s'agissait d'un scalaire ou si vos sous-programmes rentrent dans plus de 
100 recursions, ainsi que d'innombrables choses du meme genre. Voir toutes les 
entrees marquees « (W) » au chapitre 33, Messages de diagnostic. 
Cette option ne fait que positionner la variable globale $ A W Elle n'a pas d'effet sur 
les avertissements lexicaux — voir pour cela les options -W et -X. Vous pouvez acti- 
ver ou desactiver des avertissements specifiques via le pragma use warnings, decrit 
au chapitre 31. 

-W 

Active de maniere inconditionnelle et permanente tous les avertissements tout au 
long du programme, meme si les avertissements etaient desactives localement en 
utilisant no warnings ou $ A W = 0. Ceci comprend tous les fichiers charges par use, 
require ou do. Pensez-y comme l'equivalent Perl de la commande lint(\). 

-xREPERTOIRE 
-x 

Indique a Perl d'extraire un script qui est inclus dans un message. Les lignes resi- 
duelles du debut sont eliminees jusqu'a la premiere commencant par # ! et conte- 
nant la chaine « perl ». Toutes les options significatives de cette ligne apres le mot 
« perl » seront appliquees. Si un nom de repertoire est specifie, Perl basculera vers 
ce repertoire avant de lancer le script. L'option -x permet seulement d'eliminer les 
lignes superf lues du debut, pas les lignes superf lues de la fin. Le script doit se ter- 
miner par END ou par DATA s'il y a des lignes superflues a ignorer apres la 

fin du script. (Le script peut traiter au besoin tout ou partie des residus restants via 
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le handle de fichier DATA. II pourrait meme en theorie se deplacer avec seek au 
debut du fichier et traiter les residus du debut.) 

-X 

Desactive de maniere inconditionnelle et permanente tous les avertissements, exac- 
tement a l'oppose de ce que fait l'option -W. 

Variables d'environnement 

En plus des diverses options modifiant explicitement le comportement de Perl, vous 
pouvez positionner diverses variables d'environnement pour inf luencer divers compor- 
tements sous-jacents. La maniere de positionner ces variables d'environnement est de- 
pendante du systeme, mais une astuce que vous devriez connaitre si vous employez sh, 
ksh ou bash, est que vous pouvez positionner temporairement une variable d'environ- 
nement pour une seule commande, comme s'il s'agissait d'une drole de sorte d'option. 
Elle doit etre positionnee devant la commande : 

$ PATH='/bin:/usr/bin' perl ma_programmette 

Vous pouvez faire quelque chose de similaire avec un sous-shell dans csh ou tcsh : 

% (setenv PATH='/bin:/usr/bin'; perl ma_programmette) 

Sinon, vous auriez generalement positionne les variables d'environnement dans un fi- 
chier dont le nom ressemblerait a .cshrc ou .profile dans votre repertoire maison. Sous 
csh et tcsh, vous auriez ecrit : 

% setenv PATH='/bin:/usr/bin' 

Et sous sh, ksh et bash, vous auriez ecrit : 

$ PATH=Vbin:/usr/bin'j export PATH 

D'autres systemes auront d'autres moyens pour les positionner d'une maniere semi-per- 
manente. Voici les variables d'environnement auxquelles Perl accorde de l'attention : 

HOME 

Utilisee si chdir est appele sans argument. 

LC_ALL, LC_CTYPE, LC_COLLATE, LCJIUMERIC, PERLJADLANG 

Variables d'environnement controlant comment Perl gere les donnees specifiques 
aux langages naturels particuliers. Voir la documentation en ligne de perllocale. 

LOGDIR 

Utilisee si chdir est appele sans argument et si HOME n'est pas positionnee. 
PATH 

Utilisee lors de l'execution de sous-processus et dans la recherche du programme si 
l'option -S est utilisee. 

PERL5LIB 

Une liste de repertoires, separes par des deux-points, dans lesquels rechercher les 
fichiers de bibliotheque de Perl avant de les chercher dans la bibliotheque standard 
et dans le repertoire courant. Tous les repertoires specifiques a l'architecture aux 
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endroits specifies sont automatiquement inclus s'ils existent. Si la variable d'envi- 
ronnement PERL5LIB n'est pas definie, on consulte PERLLIB pour assurer une com- 
patibility anterieure avec les versions plus anciennes. 

Lors d'une execution avec verification du marquage (soit parce que le programme 
s'executait en setuid ou setgid, soit parce que Foption -T etait utilisee), aucune des 
deux variables de recherche de bibliotheque n'est utilisee. De tels programmes doi- 
vent employer le pragma use lib dans cet objectif. 

PERL50PT 

Options de ligne de commande par defaut. Les options dans cette variable sont con- 
siderees comme faisant partie de toute ligne de commande Perl. Seules les options 
-[DIMUdmw] sont autorisees. Lors d'une execution avec verifications de marquage 
(car le programme s'executait en setuid ou setgid ou si Foption -T etait utilisee), 
cette variable est ignoree. Si PERL50PT commence par -T, le marquage sera active et 
toutes les options suivantes seront ignorees. 

PERL5DB 

La commande utilisee pour charger le code du debogueur. La valeur par defaut est : 

BEGIN { require 'perl5db.pl' } 
Voir le chapitre 20 pour d'autres utilisations de cette variable. 
PERL5SHELL 

(seulement sur les portages Microsoft) Peut etre positionnee a une possibilite de 
shell que Perl doit utiliser en interne pour executer les commandes via des apostro- 
phes inverses ou via system. La valeur par defaut est cmd.exe /x/c sur WinNT et 
command . com /c sur Win95. La valeur est considered comme etant delimitee par des 
espaces. Prefixez tout caractere devant etre isole (comme un espace ou une antis- 
lash) par un antislash. 

Remarquez que Perl n'utilise pas COMSPEC pour cela car COMSPEC a un haut degre de 
variability entre les utilisateurs, ce qui amene a des soucis de portabilite. De plus, 
Perl peut utiliser un shell qui ne convienne pas a un usage interactif et le fait de 
positionner COMSPEC a un tel shell peut interferer avec le fonctionnement correct 
d'autres programmes (qui regardent habituellement COMSPEC pour trouver un shell 
permettant l'utilisation interactive). 

PERLLIB 

Une liste de repertoires, separes par des deux-points, dans lesquels rechercher les 
fichiers de bibliotheque de Perl avant de les chercher dans la bibliotheque standard 
et dans le repertoire courant. Si PERL5LIB est definie, PERLLIB n'est pas utilisee. 

PERL_DEBUC_M STATS 

Appropriee seulement si Perl est compile avec la fonction malloc incluse dans la 
distribution de Perl (c'est-a-dire si perl -V:d_mymalloc vaut « define »). Si elle est 
positionnee, cela provoque un affichage de statistiques sur la memoire apres l'exe- 
cution. Si sa valeur est un entier superieur a un, les statistiques sur la memoire sont 
egalement affichees apres la compilation. 

PERL_DESTRUCT_LEVEL 

Appropriee seulement si votre executable perl a ete construit en activant le debo- 
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gage, ceci controle le comportement de la destruction globale des objets et autres 
references. 

A part celles-ci, Perl lui-meme n'utilise pas d'autres variables d'environnement, sauf 
pour les rendre disponibles au programme s'executant et aux processus fils que lance ce 
programme. Certains modules, standard ou autres, peuvent se soucier d'autres variables 
d'environnement. Par exemple, le pragma use re utilise PERL_RE_TC et 
PERL_RE_C0L0RS, le module Cwd utilise PWD et le module CGI utilise les nombreuses va- 
riables d'environnement positionnees par votre demon HTTP (c'est-a-dire, votre ser- 
veur Web) pour passer des informations au script CGI. 

Les programmes executes en setuid feraient bien d'executer les lignes suivantes avant de 
faire quoi que ce soit d'autre, simplement pour que les gens restent honnetes : 

$ENV{PATH} = Vbin:/usr/bin''; # ou ce dont vous avez besoin 
$ENV{ SHELL} = Vbin/sh' if exists $ENV{ SHELL}; 
delete @ENV{qw(IFS CDPATH ENV BASHJNV)}; 

Voir le chapitre 23 pour plus de details. 



20 

Le debogueur Perl 



Avant tout, avez-vous essaye le pragma use warnings? 

Si vous invoquez Perl avec l'option -d, votre programme tournera sous le debogueur 
Perl. Celui-ci fonctionne comme un environnement Perl interactif, offrant une invite 
(prompting) pour des commandes de debogage qui vous permettent d'examiner le code 
source, de positionner des points d'arret, d'afficher la pile de vos appels de fonctions, de 
changer la valeur des variables et ainsi de suite. Toute commande non reconnue par le 
debogueur est directement executee (en utilisant eval) en tant que code Perl dans le pa- 
quetage du code actuellement en train d'etre debogue. (Le debogueur utilise le paque- 
tage DB pour ses propres informations d'etat, afin d'eviter de pietiner les votres.) C'est si 
formidablement pratique que les gens lancent souvent le debogueur tout seul pour tes- 
ter des constructions Perl interactivement pour voir ce qu'elles font. Dans ce cas, le pro- 
gramme que vous dites a Perl de deboguer n'a pas d'importance, nous en choisirons 
done un sans grande signification : 

% perl -de 42 

En Perl, le debogueur n'est pas un programme separe de celui qui est debogue, comme 
il Test d'habitude dans un environnement de programmation typique. L'option -d indi- 
que plutot au compilateur d'inserer des informations sur le source dans les arbres syn- 
taxiques qu'il est sur le point de passer a l'interpreteur. Cela signifie que votre code doit 
d'abord compiler correctement pour que le debogueur puisse s'en occuper. Puis si c'est 
le cas, l'interpreteur precharge un fichier de bibliotheque Perl special contenant le de- 
bogueur lui-meme. 

% perl -d /chemin/du/programme 

Le programme s'arretera immediatement avant la premiere instruction a l'execution 
(mais voir la section Utilisation du debogueur concernant les instructions a la compila- 
tion) et vous demande d'entrer une commande de debogueur. Chaque fois que le debo- 
gueur s'arrete et vous montre une ligne de code, il affiche la ligne qu'il est sur le point 
d'executer, non celle qu'il vient d'executer. 

Lorsque le debogueur rencontre une ligne, il verifie d'abord s'il y a un point d'arret, af- 
fiche la ligne (si le debogueur est en mode trace), accomplit toutes les actions (creees 
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avec la commande a decrite plus loin dans Commandes du debogueur) et finalement affi- 
che une invite (prompt) a l'utilisateur s'il existe un point d'arret ou si le debogueur est 
en mode pas-a-pas. Sinon, il evalue la ligne normalement et continue avec la ligne sui- 
vante. 

Utilisation du debogueur 

L'invite du debogueur ressemble a : 

DB<8> 
ou meme : 

DB< <17> > 

oil le numero indique combien de commandes vous avez effectuees. Un mecanisme 
d'historique ressemblant a celui de csh permet d'acceder a des commandes anterieures 
par leur numero. Par exemple, ! 17 repeterait la commande numero 17. Le nombre de 
signes inferieur/superieur indique la profondeur du debogueur. Vous en obtenez plus 
d'un, par exemple, si vous vous trouvez deja a un point d'arret et que vous affichez en- 
suite le resultat d'un appel de fonction qui comporte elle-meme un point d'arret. 

Si vous voulez entrer une commande multiligne, comme une definition de sous-pro- 
gramme comportant plusieurs instructions, vous pouvez proteger le saut de ligne qui 
termine normalement la commande du debogueur par un antislash. En voici un exem- 
ple : 

DB<1> for (1..3) { \ 
cont: print "ok\n"; \ 

cont: } 
ok 
ok 
ok 

Admettons que vous vouliez demarrer le debogueur sur un petit programme de votre 
cru (appelons-le puce_du_chameau 1 ) et arretons-le des qu'il arrive sur une fonction ap- 
pelee inf este. Voici comment vous feriez cela : 

% perl -d puceduchameau 

Loading DB routines from perl5db.pl version 1.07 
Editor support available. 

Enter h or 'h h' for help, or 'man perldebug' for more help. 

main: : (puce_du_chameau:2) : parasite('bacterie' , 4); 
DB<1> 



1. N.d.T. : En anglais, « bogue » se dit bug, qui signifie egalement « punaise », « insecte », 
« coleoptere » ou « microbe », ce qui explique les differentes allusions a des parasites dans les 
exemples de ce chapitre. Nous aurions pu adapter ces exemples a Fenveloppe de la chataigne 
(sens premier de « bogue » en francais) mais avouez qu'un bogue informatique est aussi nuisible 
que certains insectes ! 
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Le debogueur arrete votre programme juste avant la premiere instruction a l'execution 
(mais voir ci-dessous les instructions a la compilation) et vous demande d'entrer une 
commande. Encore une fois, des que le debogueur s'arrete pour vous montrer une ligne 
de code, il affiche celle qui est sur le point d'etre executee, non celle qui vient de l'etre. 
La ligne affichee peut ne pas ressembler exactement a celle presente dans votre fichier 
source, particulierement si vous l'avez lance par l'intermediaire d'un preprocesseur. 

Vous aimeriez maintenant vous arreter des votre programme arrive a la fonction in- 
f este, vous y etablissez done un point d'arret comme ceci : 

DB<1> b infeste 
DB<2> c 

Le debogueur continue maintenant jusqu'a ce qu'il tombe sur cette fonction, ou il affi- 
che ceci : 

main: :infeste(puce_du_chameau:8) : my $microbes = int rand(3); 

Pour examiner une « fenetre » de code source autour du point d'arret, utilisez la com- 
mande w : 



DB<2> w 




5 } 




6 




7 


sub infeste { 


8==>b 


my microbes = int rand(3); 


9: 


our $Maitre; 


10: 


contaminer($Maitre); 


11: 


warn "bain necessaire" 


12 


if $Maitre && $Maitre->isa 


13 




14: 


print "$microbes attrapes\n"; 


DB<2> 





Comme vous pouvez le voir grace au marqueur ==>, votre ligne courante est la numero 
8 et, grace au b qui s'y trouve, vous savez qu'elle comporte un point d'arret. Si vous aviez 
positionne une action, il y aurait egalement eu un a. Les numeros avec un deux-points 
peuvent comporter des points d'arret, les autres ne le peuvent pas. 

Pour voir qui a appele qui, demandez la trace arriere de la pile (stack backtrace) en utili- 
sant la commande T : 

DB<2> T 

$ = main: :infeste called from file 'Deplacement.pm'' line 4 

@> = Deplacement: :pattes(l, 2, 3, 4) called from file ' puce_du_chameau J line 5 

. = main: :parasite( J bacterie', 4) called from file 'puce_du_chameau' ligne 2 

Le premier caractere ($, @ ou . ) indique si la fonction a ete appelee respectivement dans 
un contexte scalaire, de liste ou vide. II y a trois lignes car vous etiez a une profondeur 
de trois fonctions lorsque vous avez lance la trace arriere de la pile. Voici ce que signifie 
chaque ligne : 

• La premiere ligne dit que vous vous trouviez dans la fonction main : : infeste lors- 
que vous avez lance la trace de la pile. Elle vous indique que la fonction a ete appe- 
lee dans un contexte scalaire depuis la ligne numero 4 du fichier Deplacement.pm. 
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Elle montre egalement qu'elle a ete appelee sans aucun argument, ce qui veut dire 
qu'elle a ete appelee en tant que Mnfeste au lieu de la maniere normale 
infesteQ. 

• La deuxieme ligne montre que la fonction Deplacement : : pattes a ete appelee dans 
un contexte de liste depuis la ligne numero 5 du fichier puce_du_chameau, avec ces 
quatre arguments. 

• La troisieme ligne montre que main : : parasite a ete appelee dans un contexte vide 
depuis la ligne numero 2 de puce_du_chameau. 

Si vous avez des instructions executables lors de la phase de compilation, comme du 
code venant de blocs BEGIN ou CHECK ou des instructions use, elles ne seront pas stop- 
pees de maniere ordinaire par le debogueur, alors que les require et les blocs INIT le 
sont, puisqu'ils interviennent apres la transition vers la phase d'execution (voir le cha- 
pitre 18, Compiler). Les instructions de la phase de compilation peuvent etre tracees avec 
l'option AutoTrace positionnee dans PERLDB_OPTS. 

Vous pouvez exercer un leger controle sur le debogueur Perl depuis l'interieur de votre 
programme Perl lui-meme. Vous pourriez faire ceci en positionnant, par exemple, un 
point d'arret automatique a un certain sous-programme lorsqu'un programme particu- 
lier s'execute sous le debogueur. Cependant, depuis votre propre code Perl, vous pouvez 
transferer de nouveau le controle au debogueur en utilisant l'instruction suivante, qui 
est inoffensive si le debogueur n'est pas lance : 

$DB: : single = l; 

Si vous positionnez $DB: : single a 2, cela equivaut a la commande n, tandis qu'une va- 
leur de 1 emule la commande s. La variable $DB: : trace devrait etre mise a 1 pour si- 
muler le t. 

Une autre facon de deboguer un module consiste a positionner un point d'arret au 
chargement : 

DB<7> b load c:/perl/lib/Carp.pm 

Will stop on load of t c:/perl/lib/Carp.pm'' . 

puis de redemarrer le debogueur en utilisant la commande R. Pour un controle plus fin, 
vous pouvez utiliser b compile nom_sous_programme pour s'arreter aussitot qu'un sous- 
programme particulier est compile. 

Commandes du debogueur 

Lorsque vous tapez des commandes dans le debogueur, vous n'avez pas besoin de les ter- 
miner par un point-virgule. Utilisez un antislash pour continuer les lignes (mais uni- 
quement dans le debogueur). 

Puisque le debogueur utilise eval pour executer des commandes, les initialisations avec 
my, our et local disparaitrons une fois la commande terminee. Si une commande du de- 
bogueur coincide avec une quelconque fonction de votre propre programme, vous 
n'avez qu'a prefixer l'appel de fonction avec quelque chose qui ne ressemble pas a une 
commande du debogueur, comme un ; ou un + au debut. 

Si la sortie d'une commande interne du debogueur defile au-dela des limites de votre 
ecran, vous n'avez qu'a prefixer la commande avec un symbole de pipe afin qu'elle passe 
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par votre pager : 
DB<1> |h 

Le debogueur comprend une grande quantite de commandes et nous les avons divisees 
(quelque peu arbitrairement) dans les categories suivantes : pas a pas et lancement, 
points d'arret, tracage, affichage, localisation de code, execution automatique de com- 
mandes et, bien entendu, divers. 

La commande la plus importante est peut-etre h, qui fournit de l'aide. Si vous tapez h h 
a l'invite du debogueur, vous obtiendrez une page d'aide compacte concue pour tenir 
sur un seul ecran. Si vous tapez h COMMANDE, vous obtiendrez de l'aide sur cette COMMANDE 
du debogueur. 

Pas a pas et lancement 

Le debogueur fonctionne en parcourant votre programme pas-a-pas (stepping), ligne par 
ligne. Les commandes suivantes vous permettent de controler ce que vous court-circui- 
tez et oil vous vous arretez. 

s 

s EXPR 

La commande s du debogueur avance dans le programme d'un seul pas. C'est-a-dire 
que le debogueur executera la prochaine ligne de votre programme jusqu'a attein- 
dre une autre instruction, en descendant dans les appels de sous-programmes si 
necessaire. Si la prochaine ligne a executer implique un appel de fonction, le debo- 
gueur s'arrete alors a la premiere ligne a l'interieur de cette fonction. Si une EXPR 
est fournie et qu'elle comprend des appels de fonctions, celles-ci seront egalement 
parcourues pas-a-pas. 

n 

n EXPR 

La commande n execute des appels de sous-programme, sans les parcourir pas a pas, 
jusqu'au debut de la prochaine instruction du meme niveau (ou d'un niveau plus 
haut). Si une EXPR est fournie et qu'elle comprend des appels de fonctions, celles-ci 
seront executees en s'arretant avant chaque instruction. 

<ENTREE> 

Si vous ne faites qu'appuyer sur la touche <ENTREE> a l'invite du debogueur, la com- 
mande s ou n precedente est repetee. 

La commande . renvoie le pointeur interne du debogueur vers la derniere ligne 
executee et affiche cette ligne. 

r 

Cette commande continue jusqu'au retour du sous-programme actuellement exe- 
cute. Elle affiche la valeur renvoyee si l'option PrintRet est positionnee, ce qui est 
le cas par defaut. 
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Points d'arret 

b 

b LIGNE 

b CONDITION 

b LIGNE CONDITION 

b NOM_SOUS_PROGRAMME 

b NOM_SOUS_PROGRAMME CONDITION 

b postpone NOM_SOUS_PROGRAMME 

b postpone NOM_SOUS_PROGRAMME CONDITION 

b compile NOM_SOUS_PROGRAMME 

b load NOMJICHIER 

La commande b du debogueur positionne un point d'arret avant la LIGNE, indi- 
quant au debogueur d'arreter le programme a cet endroit pour que vous puissiez 
fureter autour. Si LIGNE est omise, la commande positionne un point d'arret sur la 
ligne qui est sur le point d'etre executee. Si CONDITION est specifiee, elle est evaluee 
a chaque fois que l'instruction est atteinte : un point d'arret n'est declenche que si 
la CONDITION est vraie. Les points d'arret ne peuvent etre positionnes que sur les 
lignes commencant par une instruction executable. Remarquez que les conditions 
n'emploient pas if : 

b 237 $x > 30 

b 237 ++$compteur237 < 11 

b 33 /mot if/ i 

La forme b N0M_S0US_PR0GRAMME positionne un point d'arret (qui peut etre condi- 
tionnel) avant la premiere ligne du sous-programme cite. N0M_S0US_PR0GRAMME 
peut etre une variable contenant une reference de code ; si c'est le cas, CONDITION 
n'est pas implementee. 

II existe plusieurs manieres de positionner un point d'arret sur du code qui n'a 
meme pas encore ete compile. La forme b postpone positionne un point d'arret 
(qui peut etre conditionnel) a la premiere ligne de N0M_S0US_PR0GRAMME apres qu'il 
a ete compile. 

La forme b compile positionne un point d'arret sur la premiere instruction devant 
etre executee apres que N0M_S0US_PR0GRAMME a ete compile. Remarquez qu'au con- 
traire de la forme avec postpone, cette instruction se trouve a l'exterieur du sous- 
programme en question car ce dernier n'a pas encore ete appele, il a seulement ete 
compile. 

La forme b load positionne un point d'arret sur la premiere ligne execute du 
fichier. Le N0M_FICHIER devrait etre un nom de chemin complet tel qu'on l'aurait 
trouve dans les valeurs de %INC. 

d 

d LIGNE 

Cette commande supprime le point d'arret de la LIGNE ; si celle-ci est omise, la com- 
mande supprime le point d'arret sur la ligne qui est sur le point d'etre executee. 

D 

Cette commande supprime tous les points d'arret. 
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Cette commande liste tous les points d'arret et toutes les actions. 

c 

C LIGNE 

Cette commande continue l'execution, en inserant eventuellement un point 
d'arret, actif une seule fois, a la LIGNE specif iee. 

Tracage 

T 

Cette commande produit une trace arriere de la pile (backtrace stack). 

t 

t EXPR 

Cette commande bascule l'activation ou la deactivation du mode trace, qui 
imprime chaque ligne de votre programme au moment ou elle est evaluee. Voir 
egalement l'option AutoTrace, presentee plus loin dans ce chapitre. Si une EXPR est 
fournie, le debogueur tracera son execution. Voir egalement plus loin la section 
Execution autonome. 

W 

W EXPR 

Cette commande ajoute EXPR en tant qu'expression globale de surveillance. (Une 
expression de surveillance est une expression qui provoquera un point d'arret lors- 
que sa valeur changera.) Si aucune EXPR n'est fournie, toutes les expressions de sur- 
veillance sont supprimees. 

Affichage 

Le debogueur de Perl comprend plusieurs commandes pour examiner des structures de 
donnees pendant que votre programme est immobilise a un point d'arret. 

P 

p EXPR 

Cette commande est identique a print DB: :0UT EXPR dans le paquetage courant. En 
particulier, comme il s'agit de la propre fonction print de Perl, les structures de 
donnees imbriquees et les objets ne sont pas affiches — utiliser la commande x 
pour ce faire. Le handle DB: :0UT imprime sur votre terminal (ou peut-etre une 
fenetre d'editeur) quel que soit l'endroit oil la sortie standard a pu etre redirigee. 

x 

x EXPR 

La commande x evalue son expression dans un contexte de liste et affiche le resul- 
tat, agreablement presente (pretty-printed). C'est-a-dire que les structures de don- 
nees imbriquees sont imprimees recursivement et avec les caracteres invisibles 
convenablement encodes. 
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V 

V PAOUETACE 

V PAOUETACE VARS 

Cette commande affiche toutes les variables (ou quelques-unes, lorsque vous speci- 
fiez VARS) dans le PAOUETAGE specifie (main par defaut) en utilisant une presentation 
agreable (pretty printer). Les hachages affichent leurs cles et leurs valeurs, les carac- 
teres de controles sont presentes lisiblement, les structures de donnees imbriquees 
sont imprimees de maniere lisible et ainsi de suite. Ceci est identique a un appel de 
la commande x sur chaque variable possible, sauf que x fonctionne egalement avec 
les variables lexicales. De plus, vous pouvez tapez ici les identificateurs sans specifi- 
cateur de type, tel que $ ou @, comme ceci : 

V Animal: :Chameau SPOT FIDO 
Au lieu d'un nom de variable dans VARS, vous pouvez utiliser "MOTIF ou \ MOTIF 
pour imprimer les variables existantes dont le nom correspond ou ne correspond 
pas au MOTIF specifie. 

X 

X VARS 

Cette commande est identique a V PAOUETAGE_COURANT, oil PAOUE TA GE_ COURANT est 
le paquetage oil la ligne courante a ete compilee. 

H 

H -NUMERO 

Cette commande affiche la derniere commande NUMERO. Seules les commandes de 
plusieurs caracteres sont stockees dans l'historique. (Sinon, la plupart d'entre elles 
seraient des s ou des n.) Si NUMERO est omis, toutes les commandes sont listees. 

Localisation de code 

A l'interieur du debogueur, vous pouvez extraire et afficher des parties de votre pro- 
gramme avec ces commandes. 

1 

1 LIGNE 

1 NOM_SOUS_PROGRAMME 
1 MIN+INCR 
1 MIN-MAX 

La commande 1 liste quelques-unes des prochaines lignes de votre programme ou 
la LIGNE specifiee, si elle est fournie ou quelques lignes au debut du sous-pro- 
gramme ou de la reference de code NOM_SOUS_PROGRAMME. 

La forme 1 MIN+INCR liste INCR+1 lignes, en commencant a MIN. La forme 1 MIN-MAX 
liste les lignes MIN jusqu'a MAX. 

Cette commande liste quelques lignes au debut de votre programme. 



Commandes du debogueur 



483 



w 

w LIGNE 

Liste une fenetre (quelques lignes) autour de la LIGNE de code source donnee ou de 
la ligne courante, si aucune LIGNE n'est fournie. 

f NOM_FICHIER 

Cette commande vous permet de visualiser un programme ou une instruction eval 
different. Si le NOM_FICHIER n'est pas un nom de chemin absolu tel qu'on l'aurait 
trouve dans les valeurs de %INC, il est interprete en tant qu'expression reguliere 
pour trouver le nom de chemin que vous voulez. 

/MOTIF/ 

Cette commande recherche le MOTIF en avant dans votre programme ; le / final est 
optionnel. Le MOTIF entier est egalement optionnel et s'il est omis, la recherche pre- 
cedente est repetee. 

1M0TIF1 

Cette commande recherche le MOTIF en arriere dans votre programme ; le / final est 
optionnel. La recherche precedente est repetee si le MOTIF est omis. 

S 

S MOTIF 
S ! MOTIF 

La commande S liste les sous-programmes dont le nom correspond (ou avec ! , ne 
correspond pas) au MOTIF. Si aucun MOTIF n'est fourni, tous les sous-programmes 
sont listes. 

Actions et execution de commandes 

Depuis l'interieur du debogueur, vous pouvez specifier des actions a accomplir a cer- 
tains moments. Vous pouvez egalement lancer des programmes externes. 

a 

a COMMANDE 
a LIGNE 

a LIGNE COMMANDE 

Cette commande positionne une action a accomplir avant d'executer la LIGNE ou la 
ligne courante si LIGNE est omise. Par exemple, ceci affiche $truc chaque fois que la 
ligne 53 est atteinte : 

a 53 print "DB a trouve $truc\n" 
Si aucune COMMANDE n'est specifiee, Taction a la LIGNE specifiee est supprimee. Sans 
LIGNE, ni ACTION, Taction sur la ligne courante est supprimee. 

A 

La commande A du debogueur supprime toutes les actions. 



484 



Chapitre 20 — Le debogueur Perl 



< ? 

< EXPR 
« EXPR 

La forme < EXPR specifie une expression Perl a evaluer avant toute invite du debo- 
gueur. Vous pouvez ajouter une autre expression avec la forme << EXPR, les lister 
avec < ? et toutes les supprimer avec un simple <. 

> 

> ? 

> EXPR 
» EXPR 

Les commandes > se comportent exactement comme leur cousines < mais sont exe- 
cutees apres l'invite du debogueur plutot qu'avant. 

{ 

{ ? 

{ COMMANDE 
{{ COMMANDE 

Les commandes { du debogueur se comportent exactement comme < mais speci- 
fient une commande du debogueur a executer plutot qu'une expression Perl. Un 
avertissement est emis s'il apparait que vous avez accidentellement entre un bloc 
de code a la place. Si c'est vraiment ce que vous voulez faire, ecrivez le avec ; { ... 
} ou meme do { ... }. 

! NUMERO 
! -NUMERO 
! MOTIF 

Un ! isole repete la commande precedente. Le NUMERO specifie quelle commande 
executer depuis l'historique ; par exemple, ! 3 execute la troisieme commande 
tapee dans le debogueur. Si un signe moins precede le NUMERO, on compte les com- 
mandes a rebours : ! -2 execute l'avant-derniere commande. Si un MOTIF (sans 
slash) est fourni a la place d'un NUMERO, la derniere commande commencant par ce 
MOTIF est executee. Voir egalement l'option du debogueur recallCommand. 

!! CMD 

Cette commande du debogueur lance la commande externe CMD dans un sous-pro- 
cessus, qui lira depuis DB : : IN et ecrira vers DB : : OUT. Voir egalement l'option du 
debogueur shellBang. Cette commande emploie le shell cite dans $ENV{ SHE L L}, 
qui peut parfois interferer avec une interpretation correcte des informations con- 
cernant les statuts, les signaux et les core dump. Si vous voulez une valeur de sortie 
coherente, positionnez $ENV{SHELL} a /bin/sh. 

| CMD_DB 
I | CMD_PERL 

La commande \CMD_DB lance la commande CMD_DB du debogueur, en pipant 
DB: :0UT vers $ENV{PAGER}. On emploie souvent ceci avec les commandes qui pro- 
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duiraient sinon une sortie trop longue, comme : 
DB<1> |V main 

Remarquez que ceci est valable pour les commandes du debogueur et non pour cel- 
les que vous auriez tapees depuis votre shell. Si vous vouliez envoyer la commande 
externe who vers votre pager, vous pourriez faire quelque chose comme ceci : 
DB<1> ! !who | more 

La commande | \ CMD_PERL est semblable a \CMD_DB mais DB: :0UT est egalement 
temporairement selectionne (avec select), arm que toutes les commandes appe- 
lant print, printf ou write sans handle de fichier soient egalement envoyees vers 
le pipe. Par exemple, si vous aviez une fonction generant des tonnes d'affichages en 
appelant print, vous utiliseriez cette commande a la place de la precedente pour 
envoyer la sortie vers le pager : 
DB<1> sub qui { print "Utilisateurs : ", 'who' } 
DB<2> | |qui() 

Commandes diverses 

qet A D 

Ces commandes quittent le debogueur. II s'agit de la maniere recommandee de sor- 
tir du debogueur, bien que taper deux fois exit fonctionne parfois. Positionnez 
Foption inhibit_exit a 0 si vous voulez etre capable de passer directement a la fin 
du programme et de tout de meme rester dans le debogueur. Vous pouvez egale- 
ment avoir besoin de positionner $DB: : finished a 0 si vous voulez suivre la des- 
truction globale. 

R 

Redemarre le debogueur en lancant une nouvelle session avec exec. Le debogueur 
essaie de maintenir votre historique entre les sessions mais quelques reglages inter- 
nes et quelques options de la ligne de commande peuvent etre perdus. Les reglages 
suivant sont actuellement preserves : l'historique, les points d'arret, les actions, les 
options du debogueur et les options -w, -I et -e de la ligne de commande de Perl. 

= ALIAS 

= ALIAS VALEUR 

Cette commande affiche la valeur actuelle d'ALIAS si aucune VALEUR n'est fournie. 
Avec une VALEUR, elle definit une nouvelle commande du debogueur avec le nom 
ALIAS. Si ALIAS et VALEUR sont tous deux omis, tous les alias actuels sont listes. Par 
exemple : 
= quit q 

Un ALIAS devrait etre un simple identificateur et devait egalement se convertir en 
un simple identificateur. Vous pouvez obtenir des mecanismes d'alias plus sophisti- 
ques en ajoutant directement vos propres entrees a %DB: : aliases. Voir Personnali- 
sation du debogueur plus loin dans ce chapitre. 
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man 

man PAGE_DE_MANUEL 

Cette commande appelle la visionneuse de documentation par defaut de votre sys- 
teme pour la page donnee ou la visionneuse elle-meme si PAGE_DE_MANUEL est 
omise. Si cette visionneuse est man, les informations courantes de %Conf ig sont uti- 
lisees pour l'invoquer. Le prefixe « perl » sera automatiquement fourni a votre 
place si necessaire ; ceci vous permet de taper man debug et man op depuis le debo- 
gueur. 

Sur les systemes ne disposant pas d'ordinaire de l'utilitaire man, le debogueur invo- 
que perldoc ; si vous voulez changer ce comportement, positionnez $DB: :doccmd 
avec la visionneuse que vous desirez. Ceci peut etre initialise dans un fichier rc ou 
par Fintermediaire d'une affectation directe. 

0 

0 OPTION . . . 

0 OPTION? . . . 

0 OPTION=VALEUR . . . 

La commande 0 vous permet de manipuler les options du debogueur, qui sont enu- 
merees au paragraphe « Options du debogueur » plus loin dans ce chapitre. La 
form 0 OPTION positionne chacune des options listees a 1. Si un point d'interroga- 
tion suit une OPTION, sa valeur actuelle est affichee. 

La forme 0 OPTION=VALEUR positionne la valeur ; si VALEUR contient des espaces, ils 
doivent etre isoles (quoted). Par exemple, vous pouvez positionner 0 pager="less - 
MOeicsNf r" pour utiliser less avec ces drapeaux specifiques. Vous pouvez utiliser des 
apostrophes ou des guillemets, mais si c'est le cas, vous devez isoler des instances 
imbriquees avec un type de caractere de protection identique a celui avec lequel 
vous avez commence. Vous devez egalement proteger tout antislash precedant 
immediatement l'apostrophe ou le guillemet mais n'etant pas destine a proteger 
l'apostrophe ou le guillemet lui-meme. En d'autres termes, vous n'avez qu'a suivre 
les regies de l'isolement par apostrophes sans tenir compte du type de caractere 
d'isolement reellement utilise. Le debogueur repond en vous montrant la valeur 
de l'option qui vient d'etre positionnee, en utilisant toujours la notation avec des 
apostrophes dans l'affichage : 

DB<1> 0 0PTI0N='ceci nVest pas mal' 

OPTION = 'ceci nVest pas mal' 

DB<2> 0 0P7I0W="\"N'est-ce pas ?\", dit-elle" 

OPTION = '"N\'est-ce pas ?", dit-elle' 
Pour des raisons historiques, le =VALEUR est optionnel, mais vaut 1 par defaut, seule- 
ment la oil cela peut etre fait en toute securite — c'est-a-dire surtout pour les 
options booleennes. II vaut mieux affecter une VALEUR specifique en utilisant =. 
VOPTION peut etre abregee mais a moins que vous ne soyez volontairement occulte, 
il vaudrait certainement mieux vous abstenir. Plusieurs options peuvent etre posi- 
tionnees ensemble. Voir la section Options du debogueur pour en avoir la liste. 
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Personnalisation du debogueur 

Le debogueur contient probablement assez de points d'entree pour sa configuration, 
pour que vous n'ayez jamais a le modifier vous-meme. Vous pouvez changer le compor- 
tement du debogueur depuis l'interieur de ce dernier en utilisant sa commande 0, de- 
puis la ligne de commande via la variable d'environnement PERLDB_0PTS et en lancant 
l'une des commandes predefinies stockees dans des fichiers rc. 

Implementation de Vediteur pour le debogage 

Le mecanisme d'historique de la ligne de commande du debogueur n'offre pas de faci- 
lites d'edition pour la ligne de commande comme le font de nombreux shells : vous ne 
pouvez pas acceder aux lignes precedentes avec A p, ni vous deplacer au debut de la ligne 
avec A a, bien que vous puissiez executer les lignes precedentes en utilisant la syntaxe 
avec un point d'exclamation, familiere aux utilisateurs du shell. Toutefois, si vous ins- 
tallez les modules Term: :Readkey et Term: : Read Line de CPAN, vous obtiendrez des 
fonctionnalites d'edition completes, similaires a ce qu'offre GNU readline(3). 

Si emacs est installe sur votre systeme, il peut interagir avec le debogueur Perl pour four- 
nir un environnement integre de developpement logiciel, avec des reminiscences de ses 
interactions avec les debogueurs C. Perl est distribue avec un fichier de demarrage pour 
pousser emacs a agir comme un editeur sensible a la syntaxe qui comprenne la syntaxe 
(du moins, une partie) de Perl. Regardez dans le repertoire emacs du code source de la 
distribution Perl. Les utilisateurs de vi devraient egalement regarder vim (etgvim, la ver- 
sion fenetre et souris) pour obtenir une coloration des mots-cles de Perl. 

Une configuration similaire, faite par l'un des auteurs (Tom), pour interagir avec le vi 
de n'importe quel fabriquant et le systeme de fenetrage XI 1, est egalement disponible. 
Ceci fonctionne comme l'implementation integree multifenetre fournie par emacs, oil 
le debogueur dirige l'editeur. Toutefois, a l'heure oil ces lignes sont ecrites, son empla- 
cement eventuel dans la distribution de Perl reste incertain. Mais nous avons pense que 
vous deviez connaitre cette possibility. 

Personnalisation avec des fichiers d'initialisation 

Vous pouvez effectuer certaines personnalisations en configurant un fichier .perldb ou 
perldb.ini (selon votre systeme d'exploitation), contenant du code d'initialisation. Ce fi- 
chier d'initialisation contient du code Perl, et non des commandes du debogueur, et il 
est traite avant de regarder la variable d'environnement PERLDB_0PTS. Par exemple, 
vous pourriez construire des alias en ajoutant des entrees dans le hachage %DB: : alias, 
de cette maniere : 

$alias{longueur} = 's/ A longueur(.*)/p length($l)/'" ; 

$alias{stop} = ■'s/ A stop (at | in)/b/' ; 

$alias{ps} = ■'s/ A ps\b/p scalar 

$alias{quit} = ■ , s/ A quit(\s*)/exit/'; 

$alias{aide} = 's/ A aide\s*$/|h/'; 

Vous pouvez changer les options depuis votre fichier d'initialisation en utilisant les ap- 
pels de fonctions dans FAPI interne du debogueur : 
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parse_options("NonStop=l LineInfo=db.out AutoTrace=l frame=2"); 

Si votre fichier d'initialisation definit la routine afterinit, cette fonction est appelee 
apres la fin de Finitialisation du debogueur. Le fichier d'initialisation peut se trouver 
dans le repertoire courant ou dans le repertoire maison. Comme ce fichier contient du 
code Perl arbitraire, il doit appartenir au super-utilisateur ou a l'utilisateur courant et 
n'etre modifiable que par son proprietaire, pour des raisons de securite. 

Si vous voulez modifier le debogueur, copiez perl5db.pl depuis la bibliotheque Perl vers 
un autre nom et bidouillez-le selon votre inspiration. Vous voudrez alors peut-etre po- 
sitionner votre variable d'environnement PERL5DB pour ecrire quelque chose comme 
ceci : 

BEGIN { require "mon_perl5db.plx" } 

En dernier ressort, vous pourriez egalement utiliser PERL5DB pour personnaliser le de- 
bogueur en positionnant directement les variables internes ou en appelant directement 
les fonctions internes du debogueur. Toutefois, soyez bien conscient que toutes les va- 
riables et les fonctions qui ne sont documentees ni ici, ni dans les pages de manuels en 
ligne perldebug, perldebguts ou DB, sont considerees comme etant reservees a un usage 
interne et sont susceptibles d'etre modifiees sans preavis. 

Options du debogueur 

Le debogueur possede de nombreuses options que vous pouvez positionner avec la 
commande 0, soit interactivement, soit depuis l'environnement, soit depuis un fichier 
d'initialisation. 

recallCommand, ShellBang 

Les caracteres utilises pour rappeler une commande ou pour engendrer un shell. 
Par defaut, les deux options sont positionnees a ! . 

pager 

Le programme utilise pour afficher les commandes envoyees sur un pager (celles 
commencant par un caractere |). Par defaut, $ENV{PACER} sera utilise. Comme le 
debogueur utilise les caracteristiques de votre terminal courant pour les caracteres 
gras et le soulignement, si le pager choisi ne transmet pas sans changements les 
sequences d'echappement, l'affichage de certaines commandes du debogueur ne 
sera plus lisible apres leur passage dans le pager. 

tkRunning 

Execute sous le module Tk lors de l'invite (avec ReadLine). 

signalLevel, warnLevel, dieLevel 

Positionne le niveau de verbosite. Par defaut, le debogueur laisse tranquille vos 
exceptions et vos avertissements car leur alteration peut empecher le bon fonction- 
nement des programmes. 

Pour desactiver ce mode securise par defaut, placez ces valeurs a une valeur supe- 
rieure a 0. A un niveau de 1, vous obtenez une trace arriere pour tous les types 
d'avertissements (c'est souvent genant) ou toutes les exceptions (c'est souvent pre- 
cieux). Malheureusement, le debogueur ne peut pas discerner les exceptions fatales 
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et non fatales. Si die Level vaut 1, alors vos exceptions non fatales sont aussi tracees 
et alterees sans ceremonie si elles proviennent de chaines evaluees (avec eval) ou 
d'un eval quelconque a l'interieur des modules que vous essayez de charger. Si 
die Level est a 2, le debogueur ne se soucie pas de leur provenance : il usurpe vos 
gestionnaires d'exceptions et affiche une trace, puis modifie toutes les exceptions 
avec ses propres embellissements. Ceci peut etre utile dans une optique de tracage 
mais tend a desesperement semer la confusion dans tout programme prenant au 
serieux sa gestion des exceptions. 

Le debogueur essayera d'afficher un message lorsque des signaux INT, BUS ou SECV 
arriveront sans etre traites. Mais si vous vous trouvez dans un appel systeme lent 
(comme un wait, un accept ou un read depuis le clavier ou depuis une socket) et si 
vous n'avez pas positionne votre propre gestionnaire pour $SIG{INT}, vous ne serez 
alors pas capable de faire un Ctrl-C pour revenir dans le debogueur car le propre 
gestionnaire du debogueur pour $SIG{INT} ne comprend pas qu'il doit lever une 
exception et sortir des appels systeme lents par un longjmp(3). 

AutoTrace 

Positionne le mode trace (similaire a la commande t mais peut etre mise dans 
PERLDB_OPTS). 

Linelnfo 

Affecte le fichier ou le pipe dans lequel ecrire les informations sur les numeros de 
ligne. S'il s'agit d'un pipe (mettons, | visual_perl_db), alors un message court est 
utilise. C'est le mecanisme mis en oeuvre pour interagir avec un editeur esclave ou 
un debogueur visuel, comme les points d'entrees speciaux de vi ou d'emacs ou le 
debogueur graphique ddd. 

inhibit_exit 

Si cette option vaut 0, elle permet le passage direct a la fin du script. 
PrintRet 

Affiche la valeur de retour apres la commande r si cette option est activee (ce qui 
est le cas par defaut). 

ornaments 

Affecte l'apparence a Fecran de la ligne de commande (voir les documentations en 
ligne de Term: :ReadLine). II n'y a actuellement aucun moyen de desactiver les 
ornements, ce qui peut rendre certains affichages illisibles sur certains ecrans ou 
avec certains pagers. Ceci est considere comme un bogue. 

frame 

Affecte raffichage des messages a Fentree et a la sortie des sous-programmes. Si 
frame & 2 est faux, les messages ne sont affiches qu'a Fentree. (L'affichage de messa- 
ges a la sortie pourrait s'averer utile s'ils sont entrecroises avec d'autres messages). 
Si frame & 4 est vrai, les arguments des fonctions sont affiches en plus d'informa- 
tions sur le contexte et sur l'appelant. Si frame & 8 est vrai, les FETCH surcharges, 
chamifies (stringify) et lies (avec tie) sont actives sur les arguments affiches. Si 
frame & 16 est vrai, la valeur de retour du sous-programme est affichee. 
La longueur a partir de laquelle la liste d'arguments est tronquee est regie par 
Foption suivante. 
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maxTraceLen 

La longueur a laquelle la liste d'arguments est tronquee lorsque le bit 4 de l'option 
frame est positionne. 

Les options suivantes affectent ce qui se produit avec les commandes V X, et x : 

arrayDepth, hashDepth 

Affiche seulement les n premiers elements. Si n est omis, tous les elements seront 
affiches. 

compactDump, veryCompact 

Change le style de sortie des tableaux et des hachages. Si compactDump est active, les 
tableaux courts peuvent etre affiches sur une seule ligne. 

globPrint 

Afficher le contenu des typeglobs. 
DumpDBFiles 

Affiche les tableaux contenant les fichiers debogues. 
DumpPackages 

Affiche les tables de symboles des paquetages. 
DumpReused 

Affiche le contenu des adresses « reutilisees ». 

quote, HighBit, undefPrint 

Change le style d'affichage des chaihes. La valeur par defaut de quote est auto ; vous 
pouvez activer le format avec des guillemets ou avec des apostrophes en la position- 
nant a " ou respectivement. Par defaut, les caracteres dont le bit de poids fort est 
positionne sont affiches tels quels. 

UsageOnly 

Au lieu de montrer le contenu des variables de paquetage, vous obtenez lorsque 
cette option est activee, un affichage rudimentaire de l'usage de la memoire par 
paquetage, base sur la taille totale des chaines trouvees dans les variables du paque- 
tage. Puisque la table de symboles du paquetage est utilisee, les variables lexicales 
sont ignorees. 

Execution autonome 

Pendant le demarrage, les options sont initialisers a partir de $ENV{PERLDB_OPTS}. Vous 
pouvez y placer les options d'initialisation TTY, noTTY, ReadLine et NonStop. 

Si votre fichier d'initialisation contient : 

parse_options("NonStop=l LineInfo=tperl.out AutoTrace"); 

alors votre script s'executera sans intervention humaine, placant les informations de tra- 
ce dans le fichier tperl.out (Si vous l'interrompez, vous avez interet a reinitialiser 
Linelnfo k/dev/tty si vous voulez voir quelque chose.) 

Les options suivantes peuvent etre specifiees uniquement au demarrage. Pour les posi- 
tionner dans votre fichier d'initialisation, appelez parse_options("0P7=l/4/."). 
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TTY 

Le terminal a utiliser pour les entrees/sortie de debogage. 
noTTY 

Si cette option est positionnee, le debogueur entre en mode NonStop et ne se con- 
nectera pas a un terminal. En cas d'interruption (ou si le controle passe au debo- 
gueur via un reglage explicite de $DB:: signal ou de $DB:: single depuis le 
programme Perl), il se connecte au terminal specifie par l'option TTY au demarrage 
ou a un terminal trouve a l'execution en utilisant le module Term: : Rendezvous de 
votre choix. 

Ce module devrait implementer une methode appelee new, renvoyant un objet con- 
tenant deux methodes : IN et OUT. Celles-ci devraient renvoyer deux handles de 
fichiers a utiliser que le debogueur utiliserait comme son entree et sa sortie, respec- 
tivement. La methode new devrait inspecter un argument contenant la valeur de 
$ENV{PERLDB_NOTTY} au demarrage ou de "/tmp/perldbtty$$" autrement. On 
n'inspecte pas l'appartenance appropriee ni l'acces grand ouvert en ecriture de ce 
fichier, des risques de securite sont done theoriquement possibles. 

ReadLine 

Si cette option est fausse, l'implementation de ReadLine dans le debogueur est 
desactivee de facon a pouvoir deboguer les applications utilisant elles-memes le 
module ReadLine. 

NonStop 

Si cette option est mise, le debogueur entre en mode non interactif jusqu'a ce qu'il 
soit interrompu ou que votre programme positionne $DB : : signal ou $DB : : single. 

Les options peuvent parfois etre abregees de maniere unique par leur initiale mais nous 
vous recommandons de toujours les epeler en entier, pour la lisibilite et la compatibility 
future. 

Voici un exemple de l'utilisation de la variable d'environnement $ENV{PERLDB_OPTS} 
pour positionner les options automatiquement. 2 II lance votre programme de facon 
non interactive, affichant les infos a chaque entree dans un sous-programme et pour 
chaque ligne executee. La sortie de la trace du debogueur est placee dans le fichier 
tperl.out. Ceci permet a votre programme de continuer a utiliser son entree et sa sortie 
standards, sans que les informations de trace se mettent sur son chemin. 

$ PERLDB_OPTS="NonStop frame=l AutoTrace LineInfo=tperl.out" perl -d 
mon_prog 

Si vous interrompez le programme, vous aurez besoin de reinitialiser rapidement 0 
Linelnf o=/dev/tty ou a autre chose de sense sur votre plate-forme. Sinon, vous ne ver- 
rez plus l'invite du debogueur. 



2. Nous utilisons la syntaxe du shell sh pour montrer la configuration des variables d'environ- 
nement. Les utilisateurs d'autres shells feront les adaptations en consequence. 
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Implementation du debogueur 

Perl fournit des points d'entree speciaux pour le debogage, a la fois a la compilation et 
a l'execution pour creer des environnements de debogage, tels que le debogueur stan- 
dard. Ces points d 'entrees ne doivent pas etre confondus avec les options perl -D, qui 
ne sont utilisables que si votre version de Perl a ete compilee avec rimplementation - 
DDEBUCCING. 

Par exemple, a chaque fois que vous appelez la fonction interne de Perl caller, depuis 
le paquetage DB, les arguments avec lesquels l'enregistrement d'activation correspon- 
dant avait ete appele, sont copies dans le tableau @DB : : args. Lorsque vous invoquez Perl 
avec l'option -d, les fonctionnalites supplementaires suivantes sont activees : 

• Perl insert le contenu de $ENV{PERI_5DB} (ou, si cette variable est absente, BEGIN 
{require 'perl5db.pl'}) avant la premiere ligne de votre programme. 

• Le tableau @{ "_<$nom_f ichier" } contient les lignes de $nom_f ichier pour tous les 
fichiers compiles par Perl. II en va de meme pour les chaines evaluees (avec eval) 
qui contiennent des sous-programmes ou sont actuellement en cours d'execution. 
Le $nom_fichier pour les chames evaluees ressemble a (eval 34). Les affectations 
de code dans les expressions regulieres ressemblent a (re_eval 19). 

• Le hachage %{"_<$nom_fichier"} contient les points d'arret et les actions avec le 
numero de la ligne comme clef. Vous pouvez positionner des entrees individuelles, 
par opposition au hachage complet. Perl ne se soucie ici que de la verite booleenne, 
bien que les valeurs utilisees par perI5db.pl se presentent sous la forme 
"$condition_d_arretAO$action". Les valeurs dans ce hachage sont magiques dans 
un contexte numerique : elles valent zero si Ton ne peut pas placer de point d'arret 
sur la ligne. 

Le meme hachage renferme les chaines evaluees qui contiennent des sous-program- 
mes ou sont actuellement en train d'etre executees. Le $nom_f ichier pour les chai- 
nes evaluees ressemble a (eval 34) ou (re_eval 19). 

• Le scalaire ${"_<$nom_f ichier} contient "_<$nom_f ichier". Ceci est egalement le 
cas pour les chaines evaluees qui contiennent des sous-programmes ou sont actuel- 
lement en cours d'execution. Le $nom_f ichier pour les chames evaluees ressemble 
a (eval 34) ou (re_eval 19). 

• Apres que chaque fichier charge par require est compile mais avant qu'il soit exe- 
cute, DB: :postponed(*{"_<$nom_fichier"}) est appele si le sous-programme 
DB: postponed existe. Ici, le $nom_f ichier est le nom developpe du fichier charge 
par require, tel qu'on le trouve dans les valeurs de %INC. 

• Apres que chaque sous-programme nom_sous_prograimne est compile, l'existence de 
$DB: : postponed{nom_sous_programtne} est verifiee. Si cette clef existe, DB: : postpo- 
ned (nom_sous_programme) est appele si le sous-programme DB: postponed existe 
egalement. 

• Un hachage %DB : : sub est maintenu, dont les clefs sont les noms des sous-program- 
mes et dont les valeurs se presentent sous la forme nom_f ichier :ligne_debut- 
ligne_fin. nom_fichier se presente sous la forme (eval 34) pour les sous-pro- 
grammes definis a l'interieur de chaines evaluees ou (re_eval 19) pour ceux defi- 
nis a l'interieur d'affectations de code dans les expressions regulieres. 
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• Lorsque l'execution de votre programme atteint un certain point qui pourrait con- 
tenir un point d'arret, le sous-programme DB: :DB() est appele si Fune des variables 
$DB: : trace, $DB: : single ou $DB: : signal est vraie. Ces variables ne peuvent etre 
affectees par local. Cette fonctionnalite est desactivee lorsque l'execution se 
deroule a l'interieur de DB: :DB(), y compris les fonctions appelees depuis la, sauf si 
$ A D & (l< <30) est vrai. 

• Lorsque l'execution du programme atteint un appel de sous-programme, un appel 
a &DB: :sub(args) est effectue a la place, avec $DB: :sub contenant le nom du sous- 
programme appele. Ceci ne se produit pas si le sous-programme avait ete compile 
dans le paquetage DB. 

Remarquez que si &DB : : sub a besoin de donnees externes pour fonctionner, aucun ap- 
pel de sous-programme n'est possible jusqu'a ce que ceci soit accompli. Pour le debo- 
gueur standard, la variable $DB::deep (a combien de niveaux de profondeur de 
recursion pouvez-vous aller avant d'arreter obligatoirement) donne un exemple d'une 
telle dependance. 

Ecriture de son propre debogueur 

Un debogueur minimal en etat de fonctionner consiste en une ligne : 
sub DB: :DB {} 

qui, puisqu'il ne fait rien de particulier, peut facilement etre defini via la variable d'en- 
vironnement PERL5DB : 

% PERL5DB="sub DB: :DB {}" perl -d votreprogramme 

Un autre debogueur minuscule, legerement plus utile, pourrait etre cree comme ceci : 

sub DB: :DB {print ++$i; scalar <STDIN>} 

Ce petit debogueur imprimerait le numero de ligne sequentiel a chaque instruction 
rencontree et attendrait que vous entriez un retour a la ligne avant de continuer. 

Le debogueur suivant, bien qu'il paraisse petit, est vraiment tout a fait fonctionnel : 
{ 

package DB; 
sub DB {} 

sub sub {print ++$i, " $sub\n"; &$sub} 

} 

II affiche le numero sequentiel de l'appel de sous-programme et le nom du sous-pro- 
gramme appele. Remarquez que &DB: :sub doit etre compile dans le paquetage DB, tel 
que nous l'avons fait ici. 

Si vous basez votre nouveau debogueur sur le debogueur courant, il y a quelques points 
d 'entree qui peuvent vous aider a le personnaliser. Au demarrage, le debogueur lit votre 
fichier d'initialisation dans le repertoire courant ou dans votre repertoire maison. 
Apres que le fichier est lu, le debogueur lit la variable d'environnement PERLDB_OPTS et 
parcourt celle-ci comme le reliquat d'une ligne 0 . . . , telle que vous l'auriez entree a 
l'invite du debogueur. 

Le debogueur maintient egalement des variables internes magiques, comme 
@DB::dbline et %DB::dbline, qui sont des alias pour @{" : :_<fichier_courant"} et 
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%{" : : _<fichier_courant" }. Ici, fichier_courant est le fichier actuellement selection- 
ne, soit choisi explicitement avec la commande f du debogueur, soit implicitement de 
par le flux d'execution. 

Certaines fonctions peuvent faciliter la personnalisation. DB: :parse_options(CH/lI/V£) 
analyse une ligne comme Foption 0. DB : : dump_trace(S/4L/7"[ , COMPTEUR]) saute le nom- 
bre specifie d'enregistrements d'activation dans la pile (stackframes) et renvoie une liste 
contenant des informations a propos des enregistrements d'activation appelants (tous, 
si COMPTEUR est omis). Chaque entree est une reference vers un hachage avec les clefs 
« context » (., $ ou @), « sub » (nom du sous-programme ou informations sur un 
eval), « args » (undef ou une reference vers un tableau), « file » (nom du fichier) et 
« line » (numero de ligne). DB : : print_trace(HF, SAUT[ , C0MPTEUR[, COURT] ] ) impri- 
me des informations formatees, concernant les enregistrements d'activation appelants 
de la pile, dans le handle de fichier donne. Les deux dernieres fonctions peuvent s'averer 
pratiques en tant qu'arguments des commandes < et << du debogueur. 

Vous n'avez pas besoin d'apprendre tout cela — la plupart d'entre nous ne Font pas fait. 
En fait, lorsque nous avons besoin de deboguer un programme, nous ne faisons genera- 
lement qu'inserer quelques instructions print ici et la avant de relancer le programme. 

Dans des jours meilleurs, nous nous rappellerons qu'il faut activer les avertissements en 
premier. Cela fait souvent disparaitre le probleme, en evitant de nous arracher les che- 
veux (pour ce qu'il en reste). Mais lorsque cela ne fonctionne pas, il est bon de savoir, 
en vous attendant patiemment derriere cette bonne vieille option -d, qu'il existe un 
adorable petit debogueur qui peut raccommoder n'importe quoi sauf trouver les bo- 
gues a votre place. 

Mais si vous devez vous rappeler une seule chose a propos de la personnalisation du de- 
bogueur, c'est peut-etre celle-ci : ne restreignez pas la notion de bogue aux choses qui 
rendent Perl malheureux. II s'agit egalement d'un bogue si votre programme vous rend 
malheureux. Plus tot, nous vous avons montre quelques debogueurs personnalises tres 
simples. Dans le prochain paragraphe, nous allons vous montrer un exemple d'une dif- 
ferente sorte de debogueur personnalise, une sorte qui peut (ou peut ne pas) vous aider 
a deboguer le bogue connu sous le nom de « Est-ce que ce true va s'arreter un jour ? ». 

Le profileur Perl 

Voulez-vous rendre votre programme plus rapide ? La reponse est oui, bien entendu. 
Mais vous devriez d'abord vous arreter est vous demander, « Ai-je vraiment besoin de 
passer du temps a rendre ce programme plus rapide ? » L'optimisation recreative peut 
etre amusante, 3 mais normalement, vous avez mieux a faire de votre temps. Parfois, 
vous n'avez besoin que de planifier votre travail et de lancer le programme pendant que 
vous allez boire un cafe. (Ou vous prenez ceci comme excuse pour en boire un.) Mais si 
votre programme a absolument besoin de tourner plus rapidement, vous devriez com- 
mencer par le profiler. Un profileur peut vous dire quelles parties de votre programme 
prennent le plus de temps a s'executer, afin que vous ne perdiez pas de temps a optimi- 
ser un sous-programme dont les effets sont insignifiants par rapport au temps d'execu- 
tion total. 



3. Enfin, d'apres Nathan Torkington, qui a contribue a la version originate de ce paragraphe. 
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Perl est livre avec un profileur, le module Devel: :DProf. Vous pouvez l'utiliser pour 
profiler le programme Perl de mon_code.plx en tapant : 

perl -d:DProf moncode.plx 

Meme si nous l'avons appele un profileur — puisque c'est ce qu'il fait — le mecanisme 
employe par DProf est exactement le meme que celui dont nous avons parle auparavant 
dans ce chapitre. DProf n'est qu'un debogueur qui enregistre le temps entre le moment 
oil Perl entre dans chaque sous-programme et celui oil il en sort. 

Lorsque votre script profile se terminera, Dprof deversera les informations mesurant le 
temps dans un fichier nomme tmon.out. Le programme dprofpp, livre avec Perl, sait com- 
ment analyser tmon.out et produit un rapport. Vous pouvez egalement utiliser dprofpp 
comme frontal pour le processus complet avec l'option -p (voir la description plus loin). 

Etant donne ce programme : 

exterieurQ; 

sub exterieur { 

for (my $i=0; $i < 100; $i++) { interieur() } 

} 

sub interieur { 
my $total = 0; 

for (my $i=0; $i < 1000; $i++) { $total += $i } 

} 

interieurQ; 

la sortie de dprofpp est : 

Total Elapsed Time = 0.158572 Seconds 
User+System Time = 0.158572 Seconds 
Exclusive Times 

%Time ExclSec CumulS #Calls sec/call Csec/c Name 
88.2 0.140 0.140 101 0.0014 0.0014 main: :interieur 
0.00 0.000 0.139 1 0.0000 0.1393 main: :exterieur 

Remarquez que la somme des pourcentages n'est pas egale a 100. En fait, dans ce cas, elle 
en est assez loin, ce qui devrait etre un signe comme quoi vous avez besoin de lancer le 
programme plus longtemps. En regie generale, plus vous pouvez collecter de donnees 
de profilage, meilleur sera votre echantillon statistique. Si nous augmentons la boucle 
exterieure pour tourner 1000 fois au lieu de 100, nous obtiendrons des resultats plus jus- 
tes : 

Total Elapsed Time = 1.403988 Seconds 
User+System Time = 1.373988 Seconds 
Exclusive Times 

%Time ExclSec CumulS #Calls sec/call Csec/c Name 
98.2 1.350 1.348 1001 0.0013 0.0013 main: :interieur 
0.58 0.008 1.357 1 0.0085 1.3570 main: : exterieur 

La premiere ligne rapporte combien de temps le programme a mis a s'executer, du de- 
but a la fin. La seconde ligne affiche la somme de deux nombres differents : le temps 
pris pour executer votre code (« user », utilisateur) et le temps pris par le systeme d'ex- 
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ploitation a executer les appels systemes faits par votre code (« system », systeme). (Nous 
devrons admettre un peu de mauvaise precision dans ces nombres — l'horloge de l'or- 
dinateur n'a certainement pas des tics d'un millionieme de seconde. Elle peut avoir des 
tics d'un centieme de seconde si vous avez de la chance.) 

Les temps « user+system » peuvent etre changes avec les options de la ligne de comman- 
de de dprofpp. -r affiche le temps ecoule, -s le temps systeme uniquement et -u le temps 
utilisateur seulement. 

Le reste du rapport est une analyse du temps passe dans chaque sous-programme. La li- 
gne « Exclusive Times » (Temps exclusifs) indique que lorsque le sous-programme exte- 
rieur a appele le sous-programme interieur, le temps passe dans interieur n'a pas 
compte dans le calcul du temps de exterieur. Pour changer ceci et faire que le temps 
de interieur soit comptabilise dans celui d'exterieur, donnez l'option - la dprofpp. 

Pour chaque sous-programme, les informations suivantes sont rapportees : %Time, le 
pourcentage de temps passe dans l'appel a ce sous-programme ; ExclSec, le temps en se- 
condes passe dans ce sous-programmes, en n'incluant pas les sous-programmes appeles 
depuis celui-ci ; CumulS, le temps en secondes passe dans ce sous-programme et dans 
ceux appeles depuis celui-ci ; #Calls, le nombre d'appels du sous-programme ; sec/ 
call, le temps moyen en secondes de chaque appel au sous-programme, en n'incluant 
pas les sous-programmes appeles depuis celui-ci ; Csec/c, le temps moyen en secondes 
de chaque appel au sous-programme et de ceux appeles depuis celui-ci. 

De toutes ces valeurs, la plus utile est %Time, qui vous dira oil passe votre temps. Dans 
notre cas, le sous-programme interieur prend le plus de temps, nous devrions done es- 
sayer de l'optimiser ou de trouver un algorithme qui l'appellera moins souvent. : - ) 

Les options de dprofpp fournissent un acces a d'autres informations ou modifient la ma- 
niere dont les temps sont calcules. Vous pouvez egalement pousser dprofpp a lancer en 
premier lier le script a votre place, afin que vous n'ayez pas a vous souvenir de l'option 
-d:DProf: 

-p SCRIPT 

Dit a dprofpp qu'il devrait profiler le SCRIPT donne et ensuite interpreter ses don- 
nees de profilage. Voir egalement l'option -0. 

-Q 

Utilisee avec -p pour dire a dprofpp de sortir apres avoir profile le script, sans inter- 
preter les donnees. 

-a 

Trie la sortie dans l'ordre alphabetique des noms de sous-programme plutot que 
dans l'ordre decroissant des pourcentages de temps. 

-R 

Compte separement les sous-programmes anonymes definis dans le meme paque- 
tage. Le comportement par defaut est de compter tous les sous-programmes anony- 
mes en un seul, appele main: : ANON . 

-I 

Affiche les temps des sous-programmes en incluant les temps des sous-programmes 
fils. 
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-1 

Trie les sous-programmes par nombre d'appels. Ceci peut faciliter la selection de 
candidats a l'inclusion par reference (Mining). 

-0 COMPTEUR 

Montre seulement le top COMPTEUR des sous-programmes. La valeur par defaut est 
15. 

-q 

N'affiche pas les en-tetes des colonnes. 

-T 

Affiche Farbre d'appel des sous-programmes sur la sortie standard. Les statistiques 
des sous-programmes ne sont pas affichees. Une fonction appelee plusieurs fois 
(consecutivement) au meme niveau d'appel, ne sera affichee qu'une seule fois, avec 
un compteur de repetition. 

-S 

Produit un affichage structure par la maniere dont vos sous-programmes s'appel- 
lent l'un, l'autre : 

main: :interieur x 1 0.00s 

main: : exterieur x 1 1.35s = (0.01 + 1.35)s 

main: :interieur x 1000 1.35s 
Lisez ceci ainsi : le niveau superieur de votre programme a appele interieur une 
fois et pendant une duree de 0.00 s et le niveau superieur a appele exterieur une 
fois et il a tourne pendant 1.35 s inclusivement (0.01 s dans exterieur lui-meme, 
1.35 s dans les sous-programmes appeles depuis exterieur) en appelant interieur 
1000 fois (ce qui a pris 1.35 s). Waouh, compris ? 

Les branches du meme niveau (par exemple, interieur appele une fois et exte- 
rieur appele une fois) sont triees dans l'ordre des temps inclusifs. 

-U 

Ne trie pas. Affiche dans l'ordre trouve dans le fichier de profilage tel quel. 

-v 

Trie dans l'ordre des temps moyens passes dans les sous-programmes a chaque 
appel. Ceci peut faciliter l'identification de candidats pour une optimisation a la 
main en incluant par reference (Mining) le corps des sous-programmes. 

-g S0US_PR0GRAMME 

Ignore les sous-programmes sauf S0US_PR0CRAMME et tous ceux qui sont appeles 
depuis celui-ci. 

D'autres options sont decrites dans dprofpp(l), sa page de manuel standard. 

DProf n'est pas votre seul choix de profileur. CPAN contient egalement Devel : : Small- 
Prof, qui rapporte les temps passes dans chaque ligne de votre programme. Cela peut 
vous aider a vous faire une idee si vous utiliser une construction Perl particuliere qui 
s'avere etonnamment couteuse. La plupart des fonctions internes sont assez efficaces 
mais il est facile d'ecrire accidentellement une expression reguliere dont le temps syste- 
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me (overhead) croit exponentiellement avec la taille de l'entree. Voir egalement le para- 
graphe Efficacite au chapitre 24, Techniques couramment employees, pour d'autres astuces 
utiles. 



Maintenant, allez boire un cafe. Vous en aurez besoin pour le prochain chapitre. 



21 

Mecanismes internes et 
acces externes 



Comme nous l'avons explique au chapitre 18, Compilation, perl (le programme) contient 
a la fois un compilateur et un interpreteur pour les programmes ecrits en Perl (le lan- 
gage). Le compilateur/interpreteur Perl est lui-meme ecrit en C. Dans ce chapitre, nous 
allons esquisser la maniere dont les programmes en C fonctionnent si Ton se place dans 
la perspective de quelqu'un voulant soit etendre, soit inserer Perl. Lorsque vous etendez 
Perl, vous mettez un bout de code C (appele {'extension) sous le controle de Perl et lors- 
que vous inserez Perl, vous mettez un interpreteur Perl 1 sous le controle d'un program- 
me C plus large. 

La couverture succinte que nous faisons ici ne remplace en aucun cas les documenta- 
tions en ligne sur les tripes de Perl : perlguts, perlxs, perlxstut, perlcall, perlapi et h2xs, tou- 
tes livrees avec Perl. Encore une fois, a moins que vous n'etendiez ou inseriez Perl, vous 
n'aurez jamais besoin de connaitre tout ceci. 

En supposant que vous avez besoin de savoir, ce que vous devez savoir en premier est un 
peu des entrailles de Perl. Vous aurez egalement besoin de connaitre C pour la plupart 
de ce qui suit. Vous aurez besoin d'un compilateur C pour lancer les exemples. Si votre 
but final est de creer un module dont les autres gens se serviront, ils auront egalement 
besoin d'un compilateur C. Plusieurs de ces exemples ne tourneront que sur les syste- 
mes ressemblant a Unix. Oh, et ces informations sont susceptibles de changer dans les 
futures versions de Perl. 

En d'autres termes, nous penetrans en terra incognita, au risque de rencontrer des mons- 
tres marins. 



1. Alors que nous prenons soin de distinguer le compilateur de Finterpreteur lorsque cette dis- 
tinction est importante, cela devient un peu ennuyeux de persister a dire « compilateur/ 
interpreteur », nous raccourcissons done cela souvent en « interpreteur » pour signifier la globa- 
lite du code et des donnees C fonctionnant comme une instance de perl (le programme) ; lorsque 
vous incluez du Perl, vous pouvez avoir plusieurs instances de finterpreteur mais chacune se 
comporte en tant que son propre petit perl. 
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Comment fonctionne Perl 

Lorsqu'on alimente le compilateur Perl avec un programme Perl, la premiere tache qu'il 
effectue est Yanalyse lexicale : decomposer le programme en ses elements syntaxiques de 
base (souvent appeles tokens). Si le programme est : 

print "Salut, tout le monde !\n"; 

l'analyseur lexical le decompose en trois tokens : print, "Salut, tout le monde !\n" 
et le point-virgule final. La sequence de tokens est alors analysee syntaxiquement, en 
fixant les relations entre les tokens. En Perl, la frontiere entre l'analyse lexicale et syn- 
taxique est encore plus f loue que dans les autres langages. (C'est-a-dire, les autres langa- 
ges informatiques. Si vous pensez a toutes les significations que new Bestiau peut 
prendre selon qu'il s'agit d'un paquetage Bestiau ou d'un sous-programme appele new, 
vous comprendrez alors pourquoi. D'un autre cote, nous passons notre temps a lever les 
ambiguites de ce genre en francais.) 

Une fois qu'un programme a ete analyse syntaxiquement et compris (vraisemblable- 
ment), il est compile dans un arbre de codes d'ope'rations (opcodes), representant les ope- 
rations de bas niveau et finalement, cet arbre d'operations est execute — sauf si vous 
aviez invoque Perl avec l'option -c (« controle de la syntaxe »), qui sort apres avoir ter- 
mine la phase de compilation. C'est pendant la compilation, et non pendant l'execu- 
tion, que les blocs BEGIN, les blocs CHECK et les instructions use sont executes. 

Types de donnees internes 

Pendant que l'arbre de codes d'operations, constituant un programme Perl, est execute, 
des valeurs Perl sont creees, manipulees et detruites. Les types de donnees avec lesquels 
vous etes familier en Perl ont tous leur types de donnees correspondant dans le C que 
Perl a sous le capot et vous aurez besoin de connaitre ces types lorsque vous passerez des 
donnees entre les deux langages. 

Trois typedefs (definitions de type) C correspondent au trois types de donnees de base de 
Perl : SV (valeur scalaire), AV (valeur tableau) et HV (valeur hachage). De plus, IV est un 
type simple entier signe dont on est sur qu'il est assez grand pour contenir soit un poin- 
teur, soit un entier ; et 132 et 1 16 sont des types dont est sur qu'ils sont assez grands pour 
contenir respectivement 32 et 16 bits. Pour stocker les versions non signees des ces trois 
derniers typedefs, il existe egalement UV, U32 et Ul6. Tous ces typedefs peuvent etre ma- 
nipules avec les fonctions C decrites dans la documentation de perlguts. Nous esquissons 
le comportement de certaines de ces fonctions ci-dessous : 

• II existe quatre types de valeurs pouvant etre copiees dans un SV : une valeur entiere 
(IV), un double (NV), une chaine (PV) et un autre scalaire (SV). II existe des douzai- 
nes de fonctions pour les SV, pour vous permettre de creer, de modifier, d'agrandir 
et de verifier la verite booleenne ou le fait que les scalaires Perl qu'ils representent 
soient definis. Les references Perl sont implementees en tant que RV, un type special 
deSV 

• Lorsqu'un AV est cree, il peut etre cree vide ou peuple de SV, ce qui est sense 
puisqu'un tableau est une collection de scalaires. 

• Le HV possede des fonctions C associees pour stocker, recuperer, supprimer et veri- 
fier l'existence de paires clef/valeur dans le hachage que le HV represente. 
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II existe egalement un GV (valeur glob), pouvant contenir des references vers 
n'importe laquelle des valeurs associees a un identificateur de variable : une valeur 
scalaire, un valeur tableau, une valeur hachage, un sous-programme, un handle 
d'entree/sortie ou un format. 

Lorsque vous etendez Perl, vous aurez parfois besoin de connaitre ces valeurs lorsque 
vous creerez les liaisons vers les fonctions C. Lorsque vous inserez Perl, vous aurez be- 
soin de connaitre ces valeurs lorsque vous echangerez des donnees avec l'interpreteur 
Perl inclus dans votre programme C. 

Etendre Perl (utiliser du C depuis du Perl) 

Si vous voulez utiliser du code source C (ou une bibliotheque C) depuis Perl, vous devez 
creer une bibliotheque qui puisse etre chargee dynamiquement ou avec laquelle vous 
puissiez faire une edition de liens statique avec Y executable perl. (On prefere d'ordinaire 
le chargement dynamique pour minimiser le nombre des differents executablesper/ qui 
prennent place en etant differents.) Vous creez cette bibliotheque en creant un fichier 
XS (avec un suffixe .xs) contenant une serie de sous-programmes d'enveloppe (wrapper). 
Les sous-programmes d'enveloppe ne sont toutefois pas des sous-programmes Perl ; ils 
sont ecrits en langage XS et nous appelons un tel sous-programme, une XSUB (pour 
« external SUBroutine », routine externe). Une XSUB peut envelopper une fonction C 
depuis une bibliotheque externe, une fonction C ailleurs dans le fichier XS ou du code 
C brut dans la XSUB elle-meme. Vous pouvez alors utiliser l'utilitaire xsubpp, livre avec 
Perl pour prendre le fichier XS et le traduire en code C qui puisse etre compile dans une 
bibliotheque que Perl comprendra. 

En supposant que votre systeme d'exploitation implemente l'edition de liens dynami- 
que, le resultat final sera un module Perl se comportant comme tout autre module ecrit 
a 100 % en Perl pur mais contenant sous le capot du code C compile. II fait ceci en en- 
levant des arguments depuis la pile d'arguments de Perl, en convertissant les valeurs 
Perl vers les formats attendus par une fonction C particuliere (specifies a travers une de- 
claration de XSUB), en appelant la fonction C et en retransferant finalement les valeurs 
renvoyees par la fonction C vers Perl. Ces valeurs de retour peuvent etre repassees a Perl 
soit en les mettant dans la pile de Perl, soit en modifiant les arguments fournis depuis 
Perl. (Si votre systeme n'implemente pas l'edition de liens dynamique, il existe un autre 
cerceau dans lequel vous devrez sauter et nous en parlerons dans le prochain paragra- 
phed 

La description precedente est en quelque sorte une vision simplified de ce qui se passe 
reellement. Puisque Perl autorise des conventions d'appels plus flexibles que C, les 
XSUB peuvent en faire bien plus en pratique, comme verifier la validite des parametres 
d'entree, lever des exceptions, renvoyer undef ou une liste vide, appeler differentes fonc- 
tions C en se basant sur le nombre et le type des arguments ou fournir une interface 
orientee objet. Encore une fois, voir les pages de manuel de perlxs et perlxstut. 

XSetXSUB 

XS est un moyen pratique : il n'y a rien qui vous empeche d'ecrire du code de glu direc- 
tement en C et de le lier dans votre executable Perl. Toutefois, ceci serait penible, parti- 
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culierement si vous devez ecrire la glu pour de multiples fonctions C ou si vous n'etes 
pas familier avec la discipline de la pile de Perl et autres mysteres. XS vous permet d'ecri- 
re une description concise de ce qui devrait etre fait par la glu et le compilateur XS, 
xsubpp, s'occupe du reste. 

Pour les gens qui ne trouvent pas XS assez pratique, le systeme SWIG genere automati- 
quement des XSUB simples. Voir httprj/www. swig. org pour plus d'informations. 

Le langage XS vous permet de decrire la correspondance entre une fonction C et une 
fonction Perl. II vous permet egalement decrire une fonction Perl qui soit une envelop- 
pe autour de code C pur que vous ecrivez vous-meme. Lorsque XS est utiliser unique- 
ment pour faire la correspondance entre C et Perl, la declaration d'une XSUB est 
quasiment identique a la declaration d'une fonction C. Dans de telles circonstances, un 
outils appele h2xs (livre avec Perl) est capable de traduire un fichier d'en-tete C entier 
vers un fichier XS correspondant, fournissant la glu vers les fonctions C et les macros. 

Vouti\ xsubpp cree les constructions necessaires pour permettre a une XSUB de manipu- 
ler des valeurs Perl et la glu necessaire pour permettre a Perl d'appeler la XSUB. 

Un fichier XS commence par le code C que vous voulez inclure, ce qui n'est souvent rien 
de plus qu'un ensemble de directives #include. Apres un mot-cle MODULE, le reste du fi- 
chier devrait etre dans le « langage » XS, une combinaison de directives XS et de defini- 
tions de XSUB. Nous verrons bientot l'exemple d'un fichier XS complet mais en 
attendant, voici la definition d'une XSUB simple, permettant a un programme Perl 
d'acceder a une fonction de bibliotheque C, appelee szn(3). La XSUB specifie le type ren- 
voye (un nombre en virgule f lottante a double precision), le nom de la fonction et une 
liste d'argumentd (avec un argument traduit x), ainsi que le type de l'argument (un 
autre double) : 

double 
sin(x) 

double x 

Les XSUB plus compliquees contiendront souvent d'autres morceaux de code XS. Cha- 
que section d'une XSUB commence par un mot-cle suivi d'un deux-points, tel que I NIT : 
ou CLEANUP:. Cependant, les deux premieres lignes d'une XSUB contiennent toujours 
les memes donnees : la description du type renvoye et le nom de la fonction avec ses 
parametres. Tout ce qui suit immediatement ceci est considere comme etant une section 
INPUT: sauf si on le marque explicitement avec un autre mot-cle. Les divers mots-cles 
sont tous expliques dans la page de manuel perlxs, que vous devriez lire pour apprendre 
tout ce que vous pouvez faire avec les XSUB. 

Si votre systeme n'est pas capable de charger dynamiquement des bibliotheques parta- 
gees, vous pouvez toujours utiliser des XSUB mais vous devez faire une edition de liens 
statique des XSUB avec le reste de Perl, creant ainsi un nouvel executable Perl (qui 
prend place en etant different). Le mecanisme de construction d'une XSUB verifiera le 
systeme et construira une bibliotheque partagee si possible, sinon une bibliotheque sta- 
tique. Optionnellement, il peut construire un nouvel executable lie statiquement avec 
cette bibliotheque statique incluse. Mais vous pourriez vouloir attendre pour lier toutes 
vos nouvelles extensions dans un seul executable (qui prend place en etant le meme, 
puisque c'est ce qu'il est.) 

Si votre systeme est capable de lier dynamiquement les bibliotheques mais que vous 
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voulez toujours construire un executable lie statiquement, vous pouvez lancer make 
perl au lieu de make dans les exemples suivants. Vous devrez ensuite lancer make 
test_static au lieu de make test pour tester votre extension. 

Le programme xsubpp a egalement besoin de savoir comment convertir des types de 
donnees Perl en types de donnees C. II le devine souvent mais avec des types definis par 
l'utilisateur, vous pouvez avoir besoin de l'aider en specifiant la conversion dans un fi- 
chier typemap (litteralement : carte des types). Les conversions par defaut sont stockees 
dans CHEMIN- VERS -LA- BIBLIOTHEQUE/ExtUtils/typemap. 

Le fichier typemap est decoupe en trois sections. La premiere, etiquetee TYPEMAP, dit au 
compilateur quels sont les fragments de code parmi ceux des deux sections suivantes de- 
vraient etre utilisees pour faire la correspondance entre les types C et les valeurs Perl. La 
deuxieme section, INPUT, contient du code C specifiant comment les valeurs Perl de- 
vraient etre converties en types C. La troisieme section, OUTPUT, contient du code C spe- 
cifiant comment traduire les types C en valeurs Perl. 

Creation (('extensions 

Une extension convenable consiste en plusieurs fichiers : Fun contenant le code XS, plus 
des fichiers implemented qui aident Perl a deviner quoi faire avec le code XS. Vous pou- 
vez creer tous ces fichiers a la main mais il est plus facile d'utiliser l'outil h2xs, qui cree 
un squelette d'extension que vous pouvez ensuite completer : 

h2xs -A -n Montest 

Ceci cree un repertoire nomme Montest, peut-etre sous ext/ si ce repertoire existe dans 
le repertoire courant. Six fichiers seront crees dans le repertoire Montest : MANIFEST, 
Makefile.PL, Montest.pm, Montest.xs, test.pl et Changes. Nous decrivons les quatre premiers 
ci-dessous. 

MANIFEST 

Le fichier MANIFEST contient le nom de tous les fichiers qui viennent d'etre crees 
dans le repertoire Montest. Si vous ajoutez d'autres fichiers dans votre extension et 
que vous la distribuez au monde entier, ajouter le nom des fichiers ici. Ceci est teste 
par certains systemes pour s'assurer que votre distribution est complete. 

Makefile.PL 

II s'agit d'un programme Perl generant un Makefile (qui est ensuite passe a make ou 
a un equivalent). Makefile.PL est decrit plus en detail dans « Creer des modules 
CPAN » au chapitre 22, CPAN . 

Montestpm 

Les utilisateurs feront un use sur ce module lorsqu'ils voudront charger votre 
extension. Vous etes supposes remplir les blancs du module squelette cree pour 
vous par h2xs 2 : 

package Montest; 



2. N.d.T. : Le squelette genere par h2xs contient des commentaires en anglais. Toutefois, nous les 
avons traduits ici pour une meilleure comprehension. 
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use strict; 
use warnings; 

require Exporter; 
require DynaLoader; 

our @ISA = qw(Exporter DynaLoader); 

# Elements a exporter par defaut dans les espaces de noms des appelants. 

# Remarque : N'exportez pas des noms par defaut sans une tres bonne 

# raison. Utilisez plutot EXP0RT_0K. N'exportez pas betement toutes vos 

# fonctions/methodes/constantes. 
our (SEXPORT = qw( 

); 

our $VERSI0N = '0.01'; 
bootstrap Montest $VERSI0N; 

# Les methodes prechargees viennent ici. 

# Les methodes autochargees viennent apres END et sont traitees par 

# le programme autosplit. 

i; 

END 

# En-dessous se trouve une souche de documentation pour votre module. 

# Vous feriez mieux de Pediter ! 

La plupart des modules d'extension feront un require des extensions Exporter et 
DynaLoader. Apres avoir alimente @ISA (pour l'heritage) et @EXP0RT (pour rendre 
les fonctions disponibles pour le paquetage utilisant le module), le code d'initialisa- 
tion dit a Perl A'amorcer (bootstrap) le code XS. Perl lie alors dynamiquement la 
bibliotheque partagee dans le processus perl a Fexecution. 

Montestxs 

Le fichier Montestxs contient les XSUB disant a Perl comment passer les donnees 
aux routines C compilees. Initialement, Montestxs ressemblera a quelque chose 
comme ceci : 

#include "EXTERN. h" 

#include "perl.h" 

Jfinclude "XSUB.h" 

MODULE = Montest PACKAGE = Montest 

Editons le fichier XS en ajoutant ceci a la fin : 
void 
salutQ 
CODE: 

printf ("Salutj tout le monde !\n"); 
Lorsque vous lancez perl Makefile. PL, le Makefile dont make a besoin est cree : 
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% perl Makefile. PL 

Checking if your kit is complete... 
Looks good 

Writing Makefile for Montest 

Le lancement de make produit maintenant un affichage qui ressemble a ceci (certaines 
lignes trop longues ont ete raccourcies pour plus de clarte et certaines lignes accessoires 
ont ete supprimees) : 

% make 

umask 0 && cp Montest. pm ./blib/Montest.pm 

perl xsubpp -typemap typemap Montest. xs >Montest.tc && mv Montest. tc 

Montest. c 

cc -c Montest. c 

Running Mkbootstrap for Montest () 
chmod 644 Montest. bs 

LD_RUN_PATH=" " Id -o ./blib/PA-RISCl.l/auto/Montest/Montest.sl -b Montest. o 
chmod 755 ./blib/PA-RISCl.l/auto/Montest/Montest.sl 
cp Montest. bs ./blib/PA-RISCl.l/auto/Montest/Montest.bs 
chmod 644 ./blib/PA-RISCl.l/auto/Montest/Montest.bs 
Manifying ./blib/man3/Montest.3 

Nous supposons que le programme make que Perl utilise pour construire le programme 
est appele make. Au lieu de lancer make dans ces exemple, il se peut que vous deviez subs- 
tituer un autre programme make que Perl a ete configure pour utiliser. Vous pouvez 
trouver ce programme avec : 

% perl -V:make 

Le lancement de make a cree un repertoire nomine blib (pour « build library », biblio- 
theque de construction) dans le repertoire de travail courant. Ce repertoire contiendra 
la bibliotheque partagee que nous construirons. Une fois que nous sommes stirs que 
nous savons ce que nous faisons, nous pouvons l'installer depuis ce repertoire vers son 
emplacement definitif. Jusqu'alors, nous devrons ajouter explicitement le repertoire 
blib au tableau @INC de Perl en utilisant le module ExtUtils: :testlib. Si nous creons 
maintenant un fichier appele salut, ressemblant a ceci : 

use ExtUtils: :testlib; # ajoute les repertoires blib/* a (5>INC 
use Montest; 
Montest: :salut(); 

nous pouvons creuser un passage depuis Perl vers C : 

% perl salut 

Salut, le monde ! 

Une fois que notre extension est achevee et qu'elle a passe tous ses tests, nous pouvons 
l'installer avec make install. 

Vous aurez besoin des permissions en ecriture pour votre bibliotheque Perl. (Si ce n'est 
pas le cas, vous pouvez specifier un autre repertoire comme indique dans Installation des 
modules de CPAN dans la bibliotheque Perl au chapitre 22.) 
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Entrees et sorties des XSUB 

En poursuivant l'exemple precedent, nous ajouterons une seconde XSUB, prenant un 
seul argument numerique en entree et renvoyant 1 si le nombre est pair et 0 s'il est im- 
pair : 

int 

est_pair(x) 

int x 
CODE: 

RETVAL = (x %2 == 0); 
OUTPUT: 
RETVAL 

La liste des parametres de sortie arrive tout a la fin de la fonction, juste apres la directive 
OUTPUT:. L'utilisation de RETVAL indique a Perl que vous souhaitez renvoyer cette valeur 
comme valeur de retour de la XSUB. Si nous avions voulu que la fonction modifie son 
parametre d'entree, nous aurions utilise x a la place de RETVAL. 

Nous pouvons construire a nouveau notre nouvelle bibliotheque partagee avec les me- 
rries etapes qu'avant, en generant un Makefile a partir du Makefile.PL et en lancant make. 

Pour tester que notre extension fonctionne, nous creerons une suite de tests dans test.pl. 
Ce fichier est initialise par h2xs pour imiter le script de test de Perl lui-meme. Al mte- 
rieur de ce script, vous pouvez lancer des tests pour confirmer que l'extension se com- 
porte comme il faut, en affichant ok lorsque c'est le cas et not ok dans le cas contraire. 
Changez l'instruction d'affichage dans le bloc BEGIN de test.pl en print "1. .4\n"; et 
ajoutez le code suivant a la fin de ce fichier : 

print Montest: :est_pair(o) == 1 ? "ok 2" : "not ok 2", "\n"; 
print Montest: :est_pair(l) == 0 ? "ok 3" : "not ok 3", "\n"; 
print Montest: :est_pair (2) == 1 ? "ok 4" : "not ok 4", "\n"; 

Le script de test s'executera lorsque vous taperez make test. 

Utilisation desfonctions venant d'une bibliotheque C 
externe 

Jusqu'ici, nos deux exemples ne reposaient sur aucun code C se trouvant a l'exterieur 
du fichier XS. Nous utiliserons maintenant quelques fonctions de la bibliotheque ma- 
thematique C : 

void 

arrondi(arg) 

double arg 
CODE: 

if (arg > 0.0) { 

arg = floor(arg + 0.5); 
} else if (arg < 0.0) { 

arg = ceil(arg - 0.5); 
} else { 

arg = 0.0; 

} 
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OUTPUT: 

arg 

Remarquez que l'arrondi que nous definissons ci-dessus ne renvoie pas de valeur mais 
change plutot la valeur de son argument sur place. 

Les fonctions//oor(3) et ceil(3) font partie de la bibliotheque mathematique C. Si vous 
compiliez un programme C et que vous aviez besoin de faire une edition de liens avec 
la bibliotheque mathematique, vous ajouteriez -lm a la ligne de commande, c'est done 
ce que vous mettez dans la ligne LIBS du fichier Makefile.PL : 

'LIBS'" => ['-lm' ], # Se lie avec la biblio mathematique 'm' 

Generez le Makefile et lancez make. Changez le bloc BEGIN pour lancer neuf tests et ajou- 
ter ce qui suit dans test.pl : 



•i = 


-1.5; 


; Montest 


: :arrondi($i); print $i =■■ 


= -2.0 ? "ok 5" 


: "not ok 5" 


"V; 


•i = 


-1.1: 


; Montest 


: :arrondi($i); print $i =: 


= -1.0 ? "ok 6" 


: "not ok 6" 


"\n"; 


.i = 


0.0; 


Montest : 


:arrondi($i); print $i == 


0.0 ? "ok 7" : 


"not ok 7", 


"\n"; 


.i = 


0.5; 


Montest : 


:arrondi($i); print $i == 


1.0 ? "ok 8" : 


"not ok 8", 


"\n"; 


.i = 


1.2; 


Montest : 


:arrondi($i); print $i == 


1.0 ? "ok 9" : 


"not ok 9", 


"\n"; 



Le lancement de make test devrait maintenant afficher que ces neuf tests sont ok. 

La documentation, perlxstut, livree avec Perl, presente plusieurs autres exemples d'ex- 
tensions Perl, y compris un exemple utilisant h2xs pour rendre automatiquement dis- 
ponible une bibliotheque C entiere a Perl. 

Inserer Perl (utiliser Perl depuis C) 

Vous pouvez acceder a un interpreteur Perl depuis du C en inserant Perl a l'interieur de 
votre programme C. Puisque Perl est lui-meme un programme, l'insertion consiste a 
prendre les morceaux importants de Perl est a les integrer dans les votres. 

Remarquez que l'insertion n'est pas necessaire si votre seul but est d'utiliser un pro- 
gramme Perl pouvant fonctionner de maniere independante et que cela ne vous deran- 
ge pas de lancer un processus separe. Vous pouvez utiliser une fonction commepopen(3) 
de C pour echanger vos donnees entre votre programme C et tout programme Perl ex- 
terne, exactement comme vous pouvez utiliser open(PIPE, "| programme") ou 
IPC: :0pen2 et IPC: :0pen3 de Perl pour echanger des donnees entre votre programme 
Perl et tout autre programme. Mais si vous voulez eviter le surcout du lancement d'un 
processus separe, vous pouvez inserer un interpreteur dans votre programme C. 

Lors du developpement d'applications devant tourner longtemps (par exemple pour 
l'insertion dans un serveur web), c'est une bonne idee de maintenir un seul interpre- 
teur persistant plutot que de creer et de detruire des interpreteurs encore et encore. La 
raison majeure est la vitesse, puisque Perl ne sera charge qu'une seule fois en memoire. 
En utilisant un interpreteur Perl persistant, le module mod_perl d'Apache evite de char- 
ger Perl en memoire a nouveau a chaque fois que quelqu'un charge une page web 
d'Apache. La page de manuel perlembed donne un exemple d'interpreteur persistant, 
ainsi qu'un exemple de la maniere dont un programme Perl peut gerer de multiples in- 
terpreteurs simultanes (un autre atout majeur pour les serveurs web). 
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Compilation des programmes inseres 

Lorsque vous inserez Perl dans C, generalement votre programme C allouera, 
« executera » puis desallouera un objet Perllnterpreter, qui est une struct C definie 
dans la bibliotheque libperl qui a ete construite dans le processus de configuration de 
Perl pour votre systeme. La bibliotheque libperl (ainsi que EXTERN.h et perl.h, dont vous 
aurez egalement besoin) se trouve dans un repertoire qui variera d'un systeme a l'autre. 
Vous devriez etre capable de trouver le nom de ce repertoire avec : 

% perl -MConfig -e "print $Conf ig{archlib}" 

Vous devriez compiler votre programme exactement de la meme maniere que votre exe- 
cutable perl a ete compile. Tout d'abord, vous aurez besoin de savoir quel compilateur 
C a ete utilise pour construire Perl sur votre machine. Vous pouvez l'apprendre avec : 

% perl -MConfig -e "print $Config{cc}" 

Vous pouvez deviner quoi mettre sur la ligne de commande avec le module standard 
ExtUtils : : Embed. Si vous aviez un programme C appele interp.c et que votre compila- 
teur C etait cc, vous pourriez le compiler pour l'inserer comme ceci : 

% cc -o interp interp.c 'perl -MExtUtils: : Embed -e ccopts -e ldopts' 

Ajout d'un interpreteur Perl a votre programme C 

Comme perl (le programme C) s'avere etre un bon exemple d'insertion de Perl (le lan- 
gage), une demonstration simple de l'insertion peut etre trouvee dans le fichier mini- 
perlmain.c, dans le code source de Perl. Voici une version non portable de 
miniperlmain.c, contenant les principes essentiels de l'insertion : 

#include <EXTERN.h> /* depuis la distribution de Perl */ 

#include <perl.h> /* depuis la distribution de Perl */ 

static Perllnterpreter *mon_perl; /*** L' interpreteur Perl ***/ 

int main(int argc, char **argv, char **env) 
{ 

mon_perl = perl_alloc(); 
perl_construct(mon_perl); 

perl_parse(mon_perlj NULL, argc, argv, (char **)NULL); 

perl_run(mon_perl); 

perl_destruct(mon_perl); 

perl_f ree(monperl) ; 

} 

Lorsque ceci sera compile avec la ligne de commande donnee plus haut, vous serez ca- 
pable d'utiliser interp exactement comme un interpreteur perl ordinaire : 

% interp -e "printf ('%x', 3405707998)" 

cafefade 

Vous pouvez egalement utiliser des instructions Perl stockees dans un fichier en placant 
le nom du fichier dans argv[l] avant d'appeler perl_run. 
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Appel d'un sous-programme Perl depuis C 

Si un programme Perl contient un sous-programme que vous voulez appeler depuis un 
programme C, vous pouvez creer un interpreteur Perl, puis utiliser l'une des fonctions 
commencant par call_, documentees dans la page de manuel perlcall, pour invoquer 
ce sous-programme. Supposons que ceci soit votre programme Perl, appele 
affichejieure.plx : 

print "De peux pas etre affiche."; 

sub aff icheheure { 
print time; 

} 

Dans cet exemple, nous utiliserons call_argv pour invoquer le sous-programme 
aff iche_heure depuis ce programme C appele affichejieure.c : 

itinclude <EXTERN.h>; 
#include <perl.h> 

static Perllnterpreter *mon_perl; 

int main(int argc, char **argv, char **env) 
{ 

char *args[] = { NULL }; 
mon_perl = perl_alloc(); 
perl_construct(mon_perl); 
perl_parse(mon_perl, NULL, argc, argv, NULL); 

/*** court-circuite perl_run() ***/ 

call_argv("affiche_heure", G_DISCARD | GNOARGS, args); 

perl_destruct(mon_perl); 
perl_f ree(monperl) ; 

} 

Ici, nous supposons que af f ichejieure est un sous-programme Perl qui ne prend pas 
d'argument (c'est le G_N0ARGS) et pour lequel nous pouvons ignorer la valeur de retour 
(c'est le G_DISCARD). Ces drapeaux, et d'autres, sont presentes dans perlcall. Nous compi- 
lons et lancons qffichejieure comme ceci : 

% cc -o affiche_heure aff iche_heure.c 'perl -MExtUtils: : Embed -e ccopts -e 
ldopts' 

% afficheheure affiche_heure.pl 

996412873 

Dans ce cas particulier, nous n'appelons pas perl_run mais, en general, on considere que 
c'est une bonne formule pour que les methodes DESTROY et les blocs END soient executes 
au bon moment. 

Si vous voulez passer des arguments au sous-programme Perl, vous pouvez ajouter des 
chaines a la liste args, terminee par un NULL, passee a call_argv. Pour d'autres types de 
donnees, ou pour examiner les valeurs de retour, vous aurez besoin de manipuler la pile 
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de Perl. Nous aborderons ceci un peu plus tard ; pour les rouages et le cambouis, lisez 
la page de manuel per/a;//, livree avec Perl. 

Evaluation d'une instruction Perl depuis C 

Perl fournit deux fonctions pour evaluer des extraits de code Perl : eval_sv et eval_pv, 
decrites dans la page de manuel perlapi. De facon discutable, celles-ci sont les seules rou- 
tines dont vous aurez jamais besoin pour executer du code Perl depuis votre program- 
me C. Le code execute peut etre aussi long que vous le desirez, contenir plusieurs 
instructions et employer use, require ou do pour inclure d'autres fichiers Perl. 

eval_pv vous permet d'evaluer des chaines Perl individuelles, puis d'extraire des varia- 
bles pour la coercition en type C. Le programme suivant, chaine.c, execute trois chaines 
Perl, en extrayant un int depuis la premiere, un float depuis la deuxieme et un char 
* depuis la troisieme : 

#include <EXTERN.h> 
ftinclude <perl.h> 

static Perllnterpreter *mon_perl; 

main (int argc, char **argv, char **env) 
{ 

STRLEN n_a; 

char *insertion[] = { "", "-e", "0" }; 

mon_perl = perl_alloc(); 
perl_construct( mon_perl ); 

perl_parse(mon_perl, NULL, 3, insertion, NULL); 
perl_run(mon_perl); 

/** Traite $a en tant qu'entier **/ 

eval_pv("$a = 3; $a **= 2", TRUE); 

printf("a = %d\n", SvIV(get_sv("a", FALSE))); 

/** Traite $a en tant que flottant **/ 
eval_pv("$a = 3.14; $a **= 2", TRUE); 
printf("a = %f\n", SvNV(get_sv("a", FALSE))); 

/** Traite $a en tant que chaine **/ 

eval_pv("$a = 'IreP rueugnoM ertua nu erocnE'; $a = reverse($a); ", TRUE); 
printf("a = %s\n", SvPV(get_sv("a" , FALSE), n_a)); 

perl_destruct(mon_perl); 
perl_free(mon_perl); 

} 

Toutes les fonctions avec Sv dans le nom, convertissent des scalaires Perl en type de C. 
Elles sont decrites dans les pages de manuel perlguts et perlapi. Si vous compilez et exe- 
cutez ce programme, vous verrez ce qu'engendre, comme resultats, l'utilisation de SvIV 



Inse'rer Perl (utiliser Perl depuis C) 



511 



pour creer un int, SvNV pour creer un float et SvPV pour creer une chame C : 
a = 9 

a = 9.9596000 

a = Encore un autre Mongueur Perl 

Dans l'exemple precedent, nous avons cree une variable globale pour stocker temporai- 
rement la valeur calculee de notre expression evaluee. II est egalement possible (et dans 
la plupart des cas, c'est une meilleure solution) d'utiliser la valeur de retour d'eval_pv 
plutot que de s'en debarrasser : 

SV *val = eval_pv( "reverse 'IreP rueugnoM ertua nu erocnE'", TRUE); 
printf("%s\n", SvPV(val,n_a)); 

La page de manuel perlembed, livree avec Perl, comprend une demonstration de 
eval_sv vous permettant d'utiliser les fonctionnalites d'expressions regulieres de Perl 
depuis votre programme C. 

Bricolage de la pile de Perl depuis C 

En essayant d'expliquer les piles, la plupart des manuels informatiques 3 marmonnent 
quelque chose a propos d'une pile d'assiettes de cafeteria : la derniere chose que vous 
avez posee sur la pile est la premiere que vous retirez. Qn ira pour nos objectifs : votre 
programme C poussera des arguments sur « la pile de Perl », fermera les yeux pendant 
que la magie opere, puis retirera les resultats — les valeurs renvoyees par votre sous-pro- 
gramme Perl - de la pile. 

Nous allons presenter ici un exemple sans trop d'explications. Pour vraiment compren- 
dre ce qui se passe, vous aurez besoin de savoir comment faire des conversions entre les 
types C et les types Perl, avec newSVic, sv_setnv, newAV et tous leurs amis decrits dans 
les pages de manuels perlguts et perlapi. Vous aurez ensuite besoin de lire perlcall pour 
apprendre comment manipuler la pile de Perl. 

Comme C ne possede pas de fonction interne pour l'exponentiation d'entiers, rendons 
l'operateur ** de Perl accessible en C. (Ceci est moins utile qu'il n'y parait, puisque Perl 
implemente ** avec la fonction pow (3) de C.) Tout d'abord, nous allons creer une fonc- 
tion d'exponentiation dans un fichier de bibliotheque appele puissance.pl : 

sub expo { 

my ($a, $b) = @_; 
return $a ** $b; 

} 

Maintenant, nous allons creer un programme C, puissance.c, avec une fonction appele 
PuissancePerl, poussant les deux arguments dans la pile, invoquant expo et retirant la 
valeur de retour : 

#include <EXTERN.h> 
#include <perl.h> 

static Perllnterpreter *mon_perl; 



3. Plus le livre Perl de circonstance. 
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I* "Les vrais programmeurs savent ecrire du code assembleur dans 
n'importe quel langage." */ 

static void 

PuissancePerl(int a, int b) 
{ 

dSP; /* initialise un pointeur sur la pile */ 

ENTER; /* tout est cree apres ceci */ 

SAVETMPS; /* ...est une variable temporaire. */ 

PUSHMARK(SP); /* se souvient du pointeur de pile */ 

XPUSHs(sv_2mortal(newSViv(a))); /* pousse la base sur la pile */ 
XPUSHs(sv_2mortal(newSViv(b))); /* pousse l'exposant sur la pile */ 
PUTBACK; /* rend local le pointeur de pile global */ 

call_pv("expo", GSCALAR); /* appelle la function */ 

SPAGAIN; /* rafraichit le pointeur de pile */ 

/* retire la valeur de retour de la pile */ 
printf ("%d a la puissance %d vaut %d.\n\ a, b, POPi); 
PUTBACK; 

FREETMPS; /* desalloue la valeur de retour */ 

LEAVE; /* ...et les arguments « mortels » de XPUSH */ 

} 

int main (int argc, char **argv, char **env) 
{ 

char *my_argv[] = { "", "puissance.pl" }; 

mon_perl = perl_alloc(); 
perl_construct( mon_perl ); 

perl_parse(mon_perlj NULL, 2, my_argv, (char **)NULL); 
perl_run(mon_perl); 

PuissancePerl(3, 4); /*** Calcule 3 ** 4 ***/ 

perl_destruct(my_perl); 
perl_free(my_perl) ; 

} 

Vous pouvez compiler puissance.c pour donner Fexecutable puissance ainsi : 

% cc -o puissance puissance.c 'perl -MExtUtils: : Embed -e ccopts -e ldopts' 
% puissance 

3 a la puissance 4 vaut 81. 
Maintenant votre programme puissance peut prendre place en etant egalement different. 



Morale de Vhistoire 

Vous pouvez parfois ecrire du code plus rapide en C mais vous pouvez toujours ecrire 
plus rapidement du code en Perl. Puisque vous pouvez utiliser l'un depuis Fautre (et in- 
versement), vous n'avez qu'a combiner leurs forces comme il convient. (Et passez le bon- 
jour aux monstres marins des terra incognita.) 
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CPAN (Comprehensive Perl Archive Network, le reseau d'archives detaillees de Perl) est le 
depot central pour tout ce qui concerne Perl. II contient la sagesse engrangee par la com- 
munaute Perl tout entiere : des centaines de modules et de scripts Perl, une documen- 
tation representant la valeur de plusieurs livres et la distribution complete de Perl. Si 
quelque chose est ecrit en Perl, utile et libre, il est certainement sur CPAN. II existe des 
miroirs de CPAN dans le monde entier et vous pouvez en trouver pres de chez vous gra- 
ce au multiplexeur de CPAN, situe a l'adresse http://www.perl.com/CPAN. Le multi- 
plexeur se souviendra du miroir que vous avez choisi pour que vous y soyez 
automatiquement redirige lorsque vous reviendrez sur http://www.perl.com/CPAN/ (fai- 
tes attention au slash a la fin). Vous pouvez egalement commencer a www.cpan.org. L'in- 
terface est differente mais les donnees sont les memes. 

Une fois dans le repertoire principal de CPAN, vous verrez quelques sous-repertoires : 
authors 

Ce repertoire contient de nombreux sous-repertoires a raison de un par contribu- 
teur de logiciel. Par exemple, si vous desirez trouver le superbe module CGI de Lin- 
coln Stein 1 et que vous etes parvenus a savoir de source sure qu'il en est l'auteur, 
vous pouvez regarder dans authors/Lincoln _Stein. Si vous ne savez pas qui Fa ecrit, 
vous pouvez chercher dans le repertoire modules, decrit ci-dessous. 

doc 

Ce repertoire contient toutes les formes de documentation de Perl, y compris tou- 
tes les pages de manuel officielles de Perl dans plusieurs formats et arrangement 
differents, comme du texte, du HTML, du PostScript et du pod, le format natif de 
Perl, documente au chapitre 26. 

modules 

Ce repertoire contient des modules ecrits soit en Perl, soit en combinant Perl et C. 
Voir la discussion a propos du repertoire modules ci-dessous. 



1. Qui fait maintenant partie de la distribution standard de Perl. 
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ports 

Ce repertoire contient le code source et egalement quelques fois des images execu- 
tables precompilees des portages de Perl vers des systemes d'exploitations qui ne 
sont pas directement supported dans la distribution standard ou pour lesquels il est 
de notoriete publique que les compilateurs sont difficiles a se procurer. Ces porta- 
ges resultent des efforts individuels de leurs auteurs respectifs et peuvent ne pas 
fonctionner precisement comme ce livre l'indique. De nos jours, peu de systemes 
necessitent un portage specifique. II est toutefois interessant de regarder le docu- 
ment d'index de ce repertoire car il comprend egalement des informations 
detaillant le moment oil chaque vendeur de systemes a commence a livrer Perl. 

scripts 

Ce repertoire contient une petite collection de divers programmes Perl provenant 
du monde entier. lis sont tres utiles en tant que programmes seuls et comme exem- 
ples (bien que le code ne soit pas assujetti aux verifications de controle de qualite). 
En ce moment, il n'y a pas beaucoup de programmes repertories mais nous espe- 
rons que cette zone s'enrichira avec le temps. Le projet Perl Power Tool (PPT, Puis- 
sants outils en Perl) se trouve egalement ici. Le projet PPT a pour but de recreer en 
Perl tous les utilitaires standards d'Unix. La plupart des outils standards sont deja 
integres, plus quelques-uns qui ne sont pas standards. 

src 

Dans ce repertoire, vous trouverez le code source de la distribution standard de 
Perl. En fait, de deux distributions standards de Perl. L'une est indiquee comme sta- 
ble et l'autre comme devel (version de developpement). (La page d'index de ce 
repertoire explique tous les details.) II s'agit seulement de liens vers les versions 
appropriees. Au moment oil nous ecrivons, stable.tar.gz est un lien symbolique vers 
perl-5.6.1.tar.gz 2 , mais il est susceptible de pointer vers une version plus elevee au 
moment oil vous lirez ceci. Cet enorme fichier contient le code source complet et la 
documentation de Perl. La configuration et l'installation devraient etre relative- 
ment simples sur la plupart des plates-formes. Si ce n'est pas le cas, voyez le reper- 
toire ports decrit precedemment. 

Le repertoire modules de CPAN 

Bien que CPAN contiennent le code source complet de Perl, plus quelques distributions 
binaires pour les systemes prives de compilateurs C, ainsi que quelques programmes, 
CPAN est surtout connu pour sa collection de modules. 

Lorsque nous parlons de « modules », nous voulons dire trois choses : de purs modules 
Perl a 100 % (decrits aux chapitres 11 et 12), des extensions (des modules dependant de 
code C, decrits au chapitre 21) et des pragmas (des modules contenant des instructions 
speciales pour le compilateur de Perl, decrits au chapitre 31). II existe egalement sur 



2. Le schema general est que si le deuxieme nombre de la version est pair, il s'agit d'une version 
maintenue ; s'il est impair, il s'agit d'une version de developpement. L'extension .tar.gz, qui est 
parfois ecrite .tgz, indique qu'il s'agit du format standard de l'lnternet pour une archive tar GNU- 
zippee, couramment appelee « tarball ». 



Le repertoire modules de CPAN 



517 



CPAN des bundles (groupements) de modules. Les bundles sont des collections de mo- 
dules qui interagissent d'une maniere ou d'une autre et qui sont generalement la pro- 
duction d'un developpeur de modules desirant fournir une solution autonome a un 
ensemble de problemes. Si un module depend d'un autre (et eventuellement d'une ver- 
sion specifique), les developpeurs grouperont souvent les modules dans un bundle. Voir 
par exemple Bundle-XML. 

Une facon de parcourir les modules de CPAN est de vous rendre a l'adresse http:// 
search.cpan.org, qui fournit un frontal de moteur de recherche pour CPAN. Une autre 
maniere est de vous rendre sur votre miroir local de CPAN et d'entrer dans le repertoire 
modules, oil vous verrez trois sous-repertoires : by-authors, by-category et by-module (par 
auteur, par categorie et par module). Le repertoire by-module peut etre le plus utile si 
votre navigateur possede une fonctionnalite de recherche — bien que (lamentable- 
ment) certains modules ne sont disponibles que dans les repertoires sous author. Si vous 
recherchez par categorie, vous obtiendrez les choix suivants : 

Perl core modules, langage extensions, and documentation tools 

(Modules centraux de Perl, extensions de langage et outils pour la documentation) 
Cette categorie comprend des pragmas et d'autres modules standards, des modules 
qui vous aident a ecrire differemment en Perl, des modules en rapport avec le com- 
pilateur de Perl, des filtres pour le code source et des modules en rapport avec pod, 
le format de documentation de Perl. Cette categorie comprend egalement des 
modules pour generer du bytecode Java. 

Development support 

(Support du developpement) 

Cette categorie comprend des modules pour en creer d'autres et examiner com- 
ment Perl lance des programmes. 

Operating system interfaces and hardware drivers 

(Interfaces de systemes d'exploitation et pilotes materiels) 

Vous trouverez ici des modules pour interagir avec des entites etranges comme des 
systemes d'exploitations, des PalmPilots ou des ports serie. 

Networking, device control and interprocess communication 

(Communication reseau, controle de peripheriques et communication interproces- 
sus) 

Ceci comprend des modules implementant des protocoles reseau, manipulant des 
donnees reseau, maniant des modems et controlant les appareils electro-menagers 
de votre maison. 

Data types and data type utilities 

(Types de donnees et utilitaires pour les types de donnees) 

Cette categorie contient des modules pour les maths, les statistiques, les algorith- 
mes, les structures de donnees (et leurs sauvegardes persistante), les dates et les heu- 
res, la programmation orientee objet, le PDL (le langage de donnees de Perl (Perl 
Data Language)) et le POE (l'environnement objet de Perl (Perl Object Environment), 
un ordonnanceur evenementiel oriente objet). 
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Database interfaces 

(Interfaces de bases de donnees) 

Vous trouverez ici des modules vous permettant d'exploitant plusieurs douzaines 
de systemes de bases de donnees en Perl, la plupart d'entre elles avec le systeme DBI 
de Perl. Cette categorie inclut les modules DBD specifiques a chaque base de don- 
nees. 

User interfaces (character and graphical) 

(Interfaces utilisateur (en mode caracteres et graphique)) 

Cette categorie comprend des modules pour manipuler les terminaux utilisateur 
(edition de la ligne de commande et graphiques en mode caracteres dans le style de 
curses(3)), ainsi que Perl/Tk et les liens avec Gtk, Gnome, Sx et Qt pour ecrire vos 
propres interfaces graphiques en Perl. 

Interfaces to or emulations of other programming languages 

(Interfaces vers ou emulations d'autres langages de programmation) 
Cette categorie contient des modules pour utiliser d'autres langages de programma- 
tion depuis Perl ou vous permettre de pretendre que Perl n'est pas ce qu'il pretend 
etre. Si vous etes interesses par utiliser Perl en C ou C en Perl, voir le chapitre 21. 

Filenames, filesy stems, and file locking 

(Noms de fichier, systemes de fichiers et verrous de fichier) 

Cette categorie comprend des modules pour inspecter, creer, verrouiller et tout ce 
qui concerne la manipulation de fichiers et de repertoires. 

String processing, language text processing, parsing, and searching 

(Traitement de chaines et traitement, analyse et recherche de langages textuels) 
Cette categorie contient des modules pour manipuler du texte : placer des cesures, 
enrober, analyser, rechercher des variations grammaticales et faire des recherches. 
Elle comprend des modules pour manipuler du PostScript, des fontes, du XML et 
du RTF. 

Option, argument, parameter, and configuration file processing 

(Traitement d'options, d'arguments, de parametres et de fichiers de configuration) 
Cette categorie contient des modules pour traiter les arguments de la ligne de com- 
mande (le -x dans mon_prog_perl -x) et pour gerer des fichiers de configuration 
(comme les fichiers commencant par un point). 

Internationalization and locale 

(Internationalisation et locales) 

Cette categorie comprend des modules pour tailler sur mesure vos programmes 
pour un pays et une langue particuliers. 

Authentication, security, and encryption 

(Authentification, securite et cryptage) 

Vous trouverez ici des modules pour gerer des mots de passe d'utilisateurs, calculer 
des signatures de messages, crypter des donnees et authentifier des utilisateurs. 
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World Wide Web, HTML, HTTP, CGI, MIME 

(N.d.T. : vous avez compris sans traduction, non ?) 

Cette categorie contient des modules vous permettant de creer des pages web a base 
de CGI, des arpenteurs web et des systemes de gestion de contenus bases sur le web. 
D'autres modules vous permettent de gerer les cookies, d'analyser du HTML et des 
messages MIME et de manipuler des caches web. II existe egalement une section 
speciale uniquement consacree aux modules Perl que vous pouvez integrer dans le 
serveur web Apache. 

Server and daemon utilities 

(Utilitaires pour les serveurs et les demons) 

Cette categorie comprend des modules pour creer des serveurs de reseau et d'evene- 
ments. 

Archiving, compression, and conversion 

(Archivage, compression et conversion) 

Vous trouverez ici des modules pour manipuler des fichiers zip et tar et pour faire 
des conversions entre des formats de fichiers (meme le format de fichier dApple 
II). 

Images, pixmap, and bitmap manipulation, drawing, and graphing 

(Manipulations d'images, de cartes de pixels et de bits, dessins et graphiques) 
Cette categorie contient des modules pour creer des graphiques, des GIF, du VRML 
et travailler avec Gimp. 

Mail and Usenet news 

(N.d.T. : vous avez compris sans traduction, non ?) 

Dans cette categorie, vous trouverez des modules pour envoyer, recevoir et filtrer 
les mails et les news. 

Control flow utilities 

(Utilitaires de controle de flux) 

Cette categorie contient des modules pour executer du code Perl de temps a autre. 

Filehandle, directory handle, and input/output stream utilities 

(Utilitaires pour les handles de fichiers, les handles de repertoires et les flux 
d'entrees/sorties) 

Ici se trouvent des modules pour les entrees depuis des fichiers et les sorties dans 
des fichiers, y compris des fichiers journaux (log). Ceci comprend tous les modules 
10: : et un module Expect pour automatiser les dialogues avec des services reseaux 
ou d'autres programmes interactifs. 

Microsoft Windows modules 

(N.d.T. : vous avez compris sans traduction, non ?) 

Cette categorie comprend des modules pour manipuler la base de registre de Win- 
dows, ASP, ODBC, OLE et d'autres technologies specifiques a Windows. 
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Miscellaneous modules 
(Modules divers) 

Vous trouverez ici des modules pour l'astronomie, la biologie, la chimie, la valida- 
tion (ou l'invalidation) de cartes de credit, les amortissements d'hypotheques, 
Faudio, la video, la norme MIDI, la meteo et les jeux. 

Utilisation des modules de CPAN 

La plupart des modules que vous trouverez sur CPAN sont dans un format « tarball ». 
C'est-a-dire qu'ils possedent une extension de fichier en tar.gz et qu'ils sont decompresses 
dans un repertoire avec le code du module et tous les fichiers annexes, comprenant ge- 
neralement un fichier README et un fichier Makefile.PL. 

Quatre etapes rendent accessibles les modules de CPAN depuis vos programmes : la de- 
compression, le depaquetage, la construction et l'installation. La maniere dont fonc- 
tionne chacune de ces etapes depend de votre systeme d'exploitation et du module que 
vous installez, nous ne pouvons done pas vous donner de recette a toute epreuve qui 
fonctionnerait a chaque fois. Lorsque vous doutez, lisez les fichiers README et INSTALL 
qui sont, esperons-le, distribues avec le module. Lisez egalement la page de manuel de 
perlmodinstall. 

Mais il se peut que vous n'ayez jamais a reflechir a la procedure d'installation si vous 
utilisez le module CPAN (livre avec la distribution de Perl) ou PPM (Perl Package Mana- 
ger, le gestionnaire de paquetages Perl, livre avec la distribution ActiveState de Perl). 
Pour utiliser le module CPAN (a ne pas confondre avec CPAN, lui-meme), tapez : 

% perl -MCPAN -e "shell" 

sur votre ligne de commande pour commencer le processus de configuration. Apres 
avoir repondu a une variete de question sur la maniere dont vous preferez recuperer des 
fichiers, vous pouvez installer un module en tapant : 

install Un:: Module 

dans le shell du module CPAN, ou en tapant : 
% perl -MCPAN -e "install 'Un: :Module ,M 

sur votre ligne de commande ordinaire. 

Si vous ne disposez pas des avantages pratiques du module CPAN ou de PPM, vous devrez 
passer a la main les etapes decrites dans les paragraphes suivants. Les instructions sont 
donnees pour Unix, Windows et Macintosh ; pour d'autres systemes d'exploitation, con- 
sultez la page de manuel de perlmodinstall. 

Decompression et depaquetage des modules de CPAN 

La plupart des milliers d'utilitaires sur CPAN sont compresses pour occuper moins de 
place. Une fois que vous avez recupere le tarball d'un module, vous devez tout d'abord 
le transformer en une arborescence de repertoires sur votre systeme en decompressant 
(« dezippant » ) et en depaquetant le tarball. Sur Unix, vous pouvez utiliser gzip et tar 
pour faire cela. (Sur la plupart des systemes, tar fera les deux.) Sur Windows, WinZip de- 
compressera et depaquetera a la fois les tarballs. Sur un Macintosh, vous pouvez utiliser 
Stufflt, DropStuff, MacGzip ou suntar. 
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Construction des modules de CPAN 

Une minorite de modules de CPAN viennent avec du code C que vous devrez compiler 
pour votre systeme, ce qui est naturellement un probleme pour les systemes qui ne dis- 
posent pas d'un compilateur C. La procedure standard pour construire un module de 
CPAN (avec ou sans code C) reside dans les trois commandes suivantes, executees a par- 
tir de la ligne de commande. (Si vous n'avez pas de ligne de commande ou d'equivalent 
de make, vous devrez avoir recours a des mesures plus drastiques et plus dependantes du 
systeme. Les utilisateurs de Windows possedent une ligne de commande mais peuvent 
avoir besoin d'utiliser l'utilitaire nmake a la place de make.) 

% perl Makefile. PL 

% make 

% make test 

La commande perl Makefile.PL essayera de creer un Makefile, qu'utiliseront les comman- 
des make qui suivent pour determiner quels utilitaires doivent etre construits et dans 
quel ordre. La derniere commande, make test, lance la serie de tests que par bonheur 
l'auteur du module a incluse. 

Installation des modules de CPAN dans la bibliotheque 
Perl 

Si vous avez suivi les etapes precedentes, vous avez maintenant un module qui a ete 
construit et teste mais pas encore installe dans la bibliotheque de Perl. Lorsque Perl a 
ete installe sur votre systeme, un repertoire lib a ete cree pour contenir des modules, des 
pragmas et les fichiers qui s'y rapportent. II s'agit de la bibliotheque Perl, qui se situe 
generalement a un endroit comme /usr/local/lib/perI5 sur les systeme Unix et 
C:\PERL\LIB par defaut sur les systemes Windows. Les modules installed apres que Perl a 
ete construit sont stockes dans le sous-repertoire site_perl de la librairie Perl. Vous pou- 
vez voir les noms de tous les repertoires de votre bibliotheque (et un tas d'autres choses) 
en ecrivant : 

% perl -V 

Pour installer le module, tapez : 
% make install 

Cela necessite normalement d'etre super-utilisateur, meme pour installer des modules 
dans les repertoires de la bibliotheque Perl specifiques a votre site. 

Avec un peu de travail, vous pouvez installer le module dans un repertoire hors de votre 
bibliotheque Perl (comme votre repertoire maison). Au lieu de taper normalement perl 
Makefile.PL pour creer un Makefile, vous pouvez plutot utiliser cette incantation : 

% perl Makefile.PL LIB=/mon/rep/perllib \ 
INSTALLMANlDIR=/mon/rep/man/manl \ 
INSTALLMAN3DIR=/mon/rep/man/man3 \ 
INSTALLBIN=/mon/rep/bin \ 
INSTALLSCRIPT=/mon/rep/scripts 
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Ceci installera les modules quelque part dans le repertoire /mon/rep/perllib et tous les fi- 
chiers restants la oil ils doivent aller. (Si vous vous trouvez en train de taper cela souvent, 
vous pouvez meme ecrire un petit programme Perl pour le faire a votre place. Perl est 
tres bon pour accomplir des choses comme celles-la.) 

Vous pouvez ensuite indiquer a Perl de rechercher les modules dans votre repertoire 
special en ajoutant : 

use lib "/mon/rep/perllib"; 

avant que votre programme ne tente de charger le module. Vous pouvez egalement po- 
sitionner la variable d'environnement PERL5LIB a ce repertoire ou utiliser l'option de 
Perl -I. Voir le pragma use lib au chapitre 31, qui donne des exemples pour faire cela. 

Creation de modules pour CPAN 

Si vous avez un module dont vous pensez qu'il puisse etre utile aux autres, envisagez de 
rendre le monde meilleur en le telechargeant sur CPAN. Le serveur qui gere les soumis- 
sions de nouveaux modules est appele PAUSE (Perl Authors Upload Server, le serveur de 
telechargement des auteurs Perl) et on peut le trouver sur https://pause.kbx.de/pause/. 
Avant de pouvoir telecharger votre module, vous devrez obtenir un compte sur PAUSE. 
C'est un peu comme devenir un « developpeur Perl repertorie ». 

Si vous vous considerez vous-meme comme un developpeur Perl repertorie, vous devriez 
en savoir assez pour documenter vos modules. Perl possede une convention pour inclure 
la documentation a l'interieur de votre code source. (De cette maniere, vous ne l'egarez 
jamais.) Cette documentation incluse se trouve dans un format appele « pod » (pour 
Plain Old Documentation, bonne vieille documentation) et est decrite au chapitre 26. 

Vous devriez envisager de securiser votre module du point de vue des threads. Voir le 
chapitre 17, Threads. 

Vous devriez egalement vous inquieter quelque peu si votre joli petit module fait ou 
non des choses risquant de perturber la securite des gens qui l'utilisent, car les autres 
peuvent avoir de veritables bonnes raisons d'etre plus concerned par la securite que vous 
ne Fetes (POUR L'INSTANT). Voir le chapitre 23, Securite, pour tout savoir comment 
eviter d'etre tenu responsable de la 3 e Guerre Mondiale et d'autres nuisances du meme 
acabit. 

Les modules destines a etre distribues sur CPAN doivent inclure un programme Perl ap- 
pele Makefile.PL qui, lorsqu'on le lance, genere un Makefile, ainsi qu'un fichier README 
decrivant brievement ce que fait le module et comment l'installer. Le Makefde s'attend 
a comporter egalement une serie de tests. Vous pouvez creer tous ces fichiers d'un coup 
grace a l'utilitaire h2xs : 

h2xs -X -n Truc::Machin 

(Remplacez -X par -A si vous construisez un module comprenant un composant XS. XS 
est decrit au chapitre 21.) Le programme h2xs cree un seul repertoire avec des squelettes 
de fichiers que vous devrez garnir de chair. Lorsque vous avez termine, vous pouvez te- 
lecharger le repertoire dans un tarball sur PAUSE. 

Le Makefde.PL genere par h2xs ressemblera a quelque chose comme ceci : 

use ExtUtils: :MakeMaker; 
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# See lib/ExtUtil: 

# the contents of 
WriteMakefile( 



s 



./MakeMaker. pm for details of how to influence 
the Makefile that is written. 3 



NAME 

VERSI0N_FR0M 
LIBS 



> 



> 



> 



'Mon_test', 

'Mon_test.pm', # finds $VERSI0N 
["], # e.g., '-lm' 



DEFINE 
INC 



> 



> 



# e.g., ' -DHAVE_SOMETHINC' 

# e.g., ' -I/usr/include/other' 



La premiere chose que fait le Makefile.PL est de charger le module ExtUtils : :MakeMa- 
ker. La fonction WriteMakef ile de MakeMaker possede une plethore d'options (avec une 
plethore valant approximativement 88) pour vous aider a personnaliser ce qui se passe 
apres que Futilisateur a telecharge votre module depuis CPAN et a tape perl Makefile.PL 
pour commencer sa construction. La bonne nouvelle a propos de tout ceci est que, puis- 
que Futilisateur est suppose lancer le perl qui sera utilise plus tard, vous disposez d'une 
large etendue d'informations de configuration disponibles (via le module Conf ig ou la 
variable speciale $ A 0) pour vous aider a decider comment diriger MakeMaker. D'un autre 
cote, MakeMaker est vraiment excellent pour trouver des valeurs par defaut satisfaisantes 
pour presque tout, ainsi le fichier squelette ecrit par h2xs peut tres bien contenir tout ce 
dont vous avez besoin avec peut-etre un ou deux ajustements. Pour plus d'informations 
a ce sujet, voir la documentation en ligne tres complete de ExtUtils : :MakeMaker. 

Lorsque vous ecrivez un module Perl destine a un usage general, vous devriez permettre 
que la version de Perl de Futilisateur differe de la votre. Vous devriez toujours inclure 
une description en anglais de toutes les dependances (les versions particulieres de Perl, 
des pre-requis du systeme ou d'autres modules) dans le fichier README. De tout facon, 
cela ne suffira peut-etre mime pas, puisque quelqu'un qui utilise le module CPAN pour 
telecharger et installer automatiquement votre module ne verrait jamais cet avertisse- 
ment. Vous devriez done verifier les dependances dans le Makefile.PL. Voila comment 
vous pourriez vous assurer que la personne qui telecharge votre module lance Perl 5.6 
ou une version superieure : 

eval { require 5.6.0 } 
or die « 'FINJXJC'j 

### This module requires lvaluable subroutines, which are not available 
### in versions of Perl earlier than 5.6. Please upgrade! 4 
############ 
FIN DOC 



Les instructions standards pour installer un module disent a Futilisateur de lancer make 
test apres avoir construit le module avec make. Merci done d'inclure un script de test de- 



3. N.d.T. : Voir /Ub/ExtUtils/MakeMaker.pm pour les details sur comment influencer le contenu du 
Makefile genere. 

4. N.d.T. : ce module necessite des sous-programmes pris comme lvalues, qui ne sont pas dispo- 
nibles dans les versions de Perl anterieures a 5.6. Merci de mettre a niveau ! 
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cent avec tout module que vous telechargez vers CPAN. Vous devriez emuler le style 
ok/not ok que Perl emploie dans sa propre serie de tests, afin que l'utilisateur determine 
facilement le resultat de chaque test unitaire. Le fichier test.pl genere par h2xs vous aide- 
ra a demarrer. Le chapitre 21 donne des exemple de tests que vous pouvez ajouter a la 
fin de test.pl. 

Si vous avez beaucoup de tests unitaires, vous pouvez avoir envie de singer la serie de 
tests de Perl en creant un sous-repertoire appele tf dans le repertoire du module et 
d'aj outer l'extension .t au nom de vos differents scripts de test. Lorsque vous lancerez 
make test, tous les fichiers de tests seront executes automatiquement. 

Tests externes 

Les modules telecharges vers CPAN sont testes par une variete de volontaires sur diffe- 
rentes plates-formes. Ces testeurs de CPAN sont notifies par email de chaque telechar- 
gement nouveau et repondent a la liste de diffusion par PASS, FAIL, NA (non applicable 
sur cette plate-forme) ou UNKNOWN (ne sait pas), avec les remarques appropriees. Vous 
pouvez trouver la liste de diffusion des testeurs de CPAN sur cpan-testers@perl.org ; les 
resultats des tests sont postes sur http://testers.cpan.org/. 

II ne s'agit que de la phase de test preliminaire, bien entendu. La veritable phase de test 
commence lorsque quelqu'un branche votre petit module sur un serveur web qui crou- 
le sous un million de pages vues par jour. Ou lors de l'utilisation de votre module pour 
mettre au point l'avion que vous emprunterez un jour prochain. 

Alors foncez, sautez l'ecriture de ces petits tests minables. Et voyez si Ton s'en fiche... 



23 

Securite 



Que vous ayez affaire a un utilisateur assis a son clavier et tapant des commandes ou a 
quelqu'un envoyant des informations sur le reseau, la prudence s'impose pour ce qui 
est des donnees arrivant dans vos programmes car l'autre personne peut, de maniere 
malveillante ou accidentelle, vous envoyer des donnees qui feront plus de mal que de 
bien. Perl fournit un mecanisme special de verification de la securite, appele mode de 
marquage, permettant d'isoler des donnees marquees {NAT. : comme etant douteuses) 
afin de ne pas les utiliser mal a propos. Par exemple, si vous faites confiance par erreur 
a un nom de fichier marque, vous pouvez vous retrouver en train d'aj outer une entree 
a votre fichier de mots de passe alors que vous pensiez le faire sur un fichier de journal. 
Le mecanisme de marquage est expose a la section Gestion des donnees non sures. 

Dans les environnements multitaches, des actions, dans les coulisses, par des acteurs que 
Ton ne voit pas peuvent affecter la securite de votre propre programme. Si vous presup- 
posez que vous etes proprietaire exclusif d'objets externes (en particulier des fichiers) 
comme si vos processus etaient les seuls sur le systeme, vous vous exposez a des erreurs 
substantiellement plus subtiles que celles provenant directement de la gestion de don- 
nees ou de code dont la provenance est douteuse. Perl vous aide alors quelque peu en 
detectant des situations hors de votre controle. Mais pour celles dont vous avez le con- 
trole, il vous faudra comprendre quelles sont les approches a l'epreuve des etrangers in- 
visibles. La section Gestion des problemes de synchronisation discute de ces questions. 

Si la donnee que vous avez recue d'un etranger s'avere etre un morceau de code source 
a executer, vous devez etre encore plus prudent que vous ne le seriez avec une donnee. 
Perl fournit des verifications pour intercepter du code furtif deguise en donnee pour 
que vous ne l'executiez pas a votre insu. Si vous ne voulez pas executer de code etranger, 
le module Safe vous permet pourtant de mettre le code suspect en quarantaine la ou il 
ne peut plus faire aucun mal et ou il pourrait meme faire du bien. Ce sont la les themes 
de la section Gestion du code non sur. 
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Gestion des donnees non sures 

Perl facilite une programmation securisee meme lorsque le programme est utilise par 
quelqu'un de moins fiable que le programme lui-meme. C'est-a-dire que certains pro- 
grammes ont besoin d'accorder des privileges limites a leurs utilisateurs, sans accorder 
inutilement d'autres privileges. Les programmes setuid et setgid tombent dans cette ca- 
tegorie sur Unix, comme d'autres programmes tournant avec des modes de privileges 
varies sur d'autres systemes d'exploitation qui implementent de telles notions. Meme 
sur les systemes oil ce n'est pas le cas, les memes principes s'appliquent aux serveurs re- 
seaux et a tout programme lance par ces serveurs (comme les scripts CGI, les gestion- 
naires de listes de diffusion et les demons repertories dans /etc/inetd.conf). Tous ces 
programmes exigent un niveau de vigilance plus eleve que la moyenne. 

Meme les programmes lances a partir de la ligne de commande sont parfois de bons 
candidats pour le mode de marquage, tout particulierement s'ils sont destines a etre lan- 
ces par un utilisateur privilegie. Les programmes agissant sur des donnees non fiables, 
comme ceux qui generent des statistiques a partir de fichiers journaux ou qui utilisent 
LWP : : * ou Net : : * pour recuperer des donnees distantes, devraient probablement etre 
lances avec le marquage explicitement active ; les programmes imprudents risquent 
d'etre changes en « chevaux de Troie ». Puisque les programmes ne retirent aucune 
emotion a prendre des risques, il n'y a pas de raison pour qu'ils ne soient pas precaution- 
neux. 

Au regard des shells de la ligne de commande sur Unix, qui ne sont veritablement que 
des infrastructures pour appeler d'autres programmes, Perl est facile a programmer de 
maniere securisee car il est direct et autonome. A l'inverse de la plupart des langages de 
programmation shells, qui sont bases sur de nombreuses et mysterieuses passes de subs- 
titution sur chaque ligne du script, Perl emploie un modele devaluation plus conven- 
tionnel comportant moins d'inconvenients caches. De plus, comme le langage integre 
plus de fonctionnalites internes, il depend moins de programmes externes (dont la fia- 
bilite peut etre mise en doute) pour accomplir son devoir. 

Sous Unix, le berceau de Perl, le meilleur moyen de compromettre la securite du syste- 
me est de couvrir de flatteries un programme privilegie pour qu'il fasse quelque chose 
pour lequel il n'est pas prevu. Pour parer de telles attaques, Perl a developpe une appro- 
che unique pour faire face aux environnements hostiles. Perl active automatiquement 
le mode de marquage chaque fois qu'il detecte que son programme tourne avec des ID 
d'utilisateur ou de groupe reels et effectifs differents. 1 Meme si le fichier contenant vo- 
tre script Perl ne possede pas de bit setuid ou setgid active, ce script peut toujours se re- 
trouver lance en mode de marquage. Cela se produit si votre script a ete invoque par un 
autre programme, qui lui-meme etait lance sous des ID differents. Les programmes Perl 
qui ne sont pas concus pour fonctionner en mode de marquage tendent a expirer pre- 
maturement lorsqu'ils sont surpris a violer la politique de marquage de securite. Perl 
n'est pas si credule. 



1. Le bit setuid des permissions UNIX est le mode 04000, et le bit setgid est 02000 ; Tun comme 
Fautre peuvent etre positionnes pour donner a Futilisateur du programme certains des privileges 
de son (ou de ses) proprietaire(s). D'autres systemes d'exploitation peuvent conferer des privile- 
ges speciaux aux programmes par d'autres moyens, mais le principe reste le meme. 
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Vous pouvez egalement activer explicitement le mode de marquage en utilisant l'op- 
tion de la ligne de commande -T. Vous devriez le faire pour les demons, les serveurs et 
les programmes qui tournent pour le compte de quelqu'un d'autre, comme les scripts 
CGI. Les programmes qui se lancent a distance et anonymement par quelqu'un sur le 
Net sont executes dans le plus hostile des environnements. Vous ne devriez pas craindre 
de dire « Non ! » de temps en temps. Contrairement a la croyance populaire, vous pou- 
vez faire preuve d'une grande prudence sans pour autant vous transformer en prude 
faussement effarouchee. 

Sur les sites les plus consciencieux en matiere de securite, lancer tous les scripts CGI avec 
l'option -T n'est pas seulement une bonne idee : c'est la regie. Nous ne pretendons pas 
que lancer les scripts en mode de marquage est suffisant pour les rendre securises. Ce 
n'est pas le cas et cela prendrait un livre entier pour seulement mentionner tout ce qu'il 
faudrait faire. Mais si vous n'executez pas vos scripts CGI en mode de marquage, vous 
faites inutilement l'impasse sur la protection la plus forte que Perl puisse vous offrir. 

Pendant qu'il se trouve en mode de marquage, Perl prend des precautions particulieres 
appelees verifications du marquage (taint checks) pour se premunir contre les pieges 
qu'ils soient triviaux ou subtils. Certaines de ces precautions sont assez simples, comme 
de verifier que les variables d'environnement dangereuses ne soient pas positionnees et 
que les repertoires de votre PATH ne soient pas modifiables par quelqu'un d'autre ; les 
programmeurs prudents ont toujours precede ainsi. D'autres verifications sont toute- 
fois mieux assurees par le langage lui-meme et ce sont celles-la qui contribuent a rendre 
un programme Perl privilegie plus sur que le programme C correspondant ou un script 
CGI en Perl plus securise que le mime script dans un langage sans verifications de mar- 
quage. (C'est-a-dire, pour autant que nous le sachions, tous les langages a part Perl.) 

Le principe est simple : vous ne pouvez pas utiliser des donnees derivees de l'exterieur 
d'un programme pour affecter quelque chose d'autre en dehors de ce programme — du 
moins, pas accidententellement. Tout ce qui provient de l'exterieur du programme est 
marque, ce qui comprend tous les arguments de la ligne de commande, les variables 
d'environnement et les fichiers en entree. Les donnees marquees ne peuvent etre utili- 
ses directement ou indirectement dans toute operation invoquant un sous-shell ou 
modifiant des fichiers, des repertoires ou des processus. Toute variable positionnee dans 
une expression ayant precedemment reference une valeur marquee devient elle-meme 
marquee, meme s'il est logiquement impossible que la valeur marquee ait influence la 
variable. Le marquage etant associe a chaque valeur scalaire, certaines valeurs indivi- 
duelles d'un tableau ou d'un hachage peuvent etre marques et d'autres non. (Seules les 
valeurs dans un hachage peuvent etre marquees et non les clefs.) 

Le code suivant illustre comment le marquage fonctionnerait si vous executiez toutes 
ces instructions dans l'ordre. Les instructions indiquees « Non sures » leveraient une ex- 
ception, contrairement a celles qui sont « OK ». 

$arg = shift (@ARGV); # $arg est maintenant marque (a cause de @ARGV) . 

$cache = "$arg, 'true'"; # $cache est aussi marque (a cause de $arg). 

$ligne = <>; # Marque (lu a partir d'un fichier externe) . 

$chemin = $ENV{PATH}; # Marque a cause de %ENV, mais voir plus loin. 

$perso = 'abc'; # Non marque. 



system "echo $perso"; 



# Non sur avant que le PATH ne soit positionne. 
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system "echo $arg"; # Non sur : utilise sh avec $arg marque, 

system "echo", $arg; # OK une fois que le PATH est positionne 

# (n'utilise pas sh). 
system "echo $cache"; # Non sur de deux facons : marque et PATH. 

$vieux_chemin = $ENV{PATH}; # $vieux_chemin est marque (a cause de %EIW). 
$ENV{PATH} = 'bin:/usr/bin'; # (R on d'autres programmes.) 

$nouveau_chemin = $ENV{PATH}; # $nouveau_chemin n'est PAS marque. 

delete @ENV{qw{IFS 

CDPATH 
ENV 

BASH_ENV}}; # Rend %ENV plus sur. 

system "echo $perso"; # OK, est sur une fois que le PATH est reinitialise, 
system "echo $cache"; # Non sur via $cache qui est marque. 

open(0UF, "< $arg"); # OK (ouvertures en lecture seule non verifiees). 
open(0UF, "> $arg"); # Non sur (tentative d'ecriture dans arg qui est 
# marque). 

open(0UF, "echo $arg|") # Non sur via $arg qui est marque, mais... 

or die "impossible de faire un pipe sur echo : $!"; 

open(0UF, "- | ") # Considere OK : voir ci-dessous pour 

or exec 'echo', $arg # l'exemption de marquage sur une liste 
or die "exec echo impossible : $!"; # exec-utee. 

open(0UF, "- | ", "echo", $arg) # Comme precedemment, considere OK. 
or die "impossible de faire un pipe sur un echo : $!"; 

$cri = 'echo $arg'; # Non sur via $arg qui est marque. 

$cri = 'echo abc'; # $cri est marque a cause des apostrophes inverses. 

$cri2 = 'echo $cri'; # Non sur via $cri qui est marque. 

unlink $perso, $arg; # Non sur via $arg qui est marque, 

umask $argj # Non sur via $arg qui est marque. 

exec "echo $arg"; # Non sur via $arg qui est marque et passe au shell, 
exec "echo", $arg; # Considere OK ! (Mais voir ci-dessous.) 
exec "sh", ' -c' , $arg; # Considere OK, mais a tort ! 

Si vous essayez de faire quelque chose de non sur, vous obtiendrez une exception (qui 
devient une erreur fatale si elle n'est pas interceptee) comme « Insecure dependency » 
ou « Insecure $ENV{PATH} » (« Dependance non sure » ou « $ENV{PATH} non sur ». 
Voir la section Nettoyage de votre environnement plus loin. 

Si vous passez une LISTE a un system, un exec ou un open de pipe, les arguments ne 
sont pas inspected pour verifier s'ils sont marques car, avec une LISTE d'arguments, Perl 
n'a pas besoin d'invoquer le shell, qui est potentiellement dangereux, pour lancer la 
commande. Vous pouvez toujours ecrire facilement un system, un exec ou un open de 
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pipe non sur en utilisant la forme avec LISTE, comme le demontre le dernier exemple 
ci-dessus. Ces formes sont exemptes de verification car vous etes supposes savoir ce que 
vous faites lorsque vous les employez. 

Parfois, vous ne pouvez toutefois pas dire combien d'arguments vous etes en train de 
passer. Si vous fournissez a ces fonctions un tableau 2 qui ne contient qu'un element, 
c'est alors exactement comme si vous passiez une chaine en premier et le shell pourrait 
alors etre utilise. La solution est de passer un chemin explicite dans Femplacement pour 
un objet indirect : 

system @args; # N'appellera pas le shell sauf si @args == 1. 

system { $args[o] } @args; # Court-circuite le shell meme avec une liste 

# cPun seul argument. 

Detection et blanchiment des donnees marquees 

Pour tester si une variable scalaire contient ou non une donnee marquee, vous pouvez 
utiliser la fonction est_marquee suivante. Elle utilise le fait que eval CHAINE leve une 
exception si vous essayez de compiler des donnees marquees. Cela ne fait rien que la va- 
riable $nada employee dans l'expression a compiler soit toujours vide ; elle sera encore 
marquee si $arg Test. Le eval BLOC exterieur n'effectue aucune compilation. II n'est ici 
que pour intercepter l'exception levee si Ton donne une donnee marquee a l'eval inte- 
rieur. Puisqu'il est garanti que la variable $@ n'est pas vide apres chaque eval si une ex- 
ception a ete levee et vide sinon, nous renvoyons le resultat du test verifiant si sa 
longueur etait nulle : 

sub estjnarquee { 
my $arg = shift; 

my $nada = substr($arg, 0,0); # longueur nulle 
local $@; # preserve la version de l'appelant 
eval { eval "# $nada" }; 
return length($@) != 0; 

} 

Mais tester le marquage ne vous en dit pas plus. Generalement, vous savez parfaitement 
quelles variables contiennent des donnees marquees — il vous suffit de nettoyer le mar- 
quage des donnees. Le seul moyen officiel de court-circuiter le mecanisme de marquage 
consiste a referencer des variables de sous-motifs determines par une precedente recher- 
che de correspondance d'expression reguliere. 3 Lorsque vous ecrivez un motif conte- 
nant des parentheses capturantes, vous pouvez acceder aux sous-chames capturees par 
le biais des variables de correspondance comme $1, $2 et $+ ou en evaluant le motif dans 
un contexte de liste. Quel que soit le moyen employe, on presume que vous etiez au cou- 



2. Ou une fonction produisant une liste. 

3. Un moyen officieux consiste a stocker une chaine marquee comme clef d'un hachage et de 
recuperer a nouveau cette clef. Car les clefs ne sont pas des SV complets (nom interne des valeurs 
scalaires), elles ne portent pas sur elle la propriete du marquage. Ce comportement peut changer 
un jour ou Fautre, ne comptez done pas dessus. Soyez prudent lorsque vous manipulez des clefs, 
de peur que vous n'enleviez accidentellement le marquage de vos donnees et que vous ne fassiez 
quelque chose de dangereux avec. 
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rant de ce que vous etiez en train de faire lorsque vous avez ecrit le motif et que vous 
Favez ecrit de maniere a eviter tout danger. Vous devez done reflechir un peu — ne 
blanchissez jamais aveuglement ou e'est tout le mecanisme qui sera invalide. 

II vaut mieux verifier que la variable ne contient que des caracteres valides au lieu de 
regarder si elle contient des caracteres invalides. Ceci car il est beaucoup trop facile d'en 
rater auxquels vous n'auriez jamais pense. Par exemple, voici un test destine a s'assurer 
que $chaine ne contient que des caracteres « de mot » (alphabetiques, numeriques et 
soulignes), des tirets, des signes et des points : 

if ($chaine =~ / A ([-\(S\w. ]+)$/) { 

$chaine = $1; # $chaine est maintenant non marquee. 

} else { 

die "Mauvaises donnees dans $chaine"; # Enregistrez ceci quelque part. 

} 

Ceci rend $chaine raisonnablement fiable pour l'utiliser ensuite dans une commande 
externe, puisque Aw+/ ne correspond generalement pas a des metacaracteres du shell, 
et que les autres caractere ne veulent rien dire de particulier pour le shell. 4 II aurait ete 
dangereux d'utiliser /(.+)/ car ce motif laisse tout passer, ce que Perl ne verifie pas. Au 
moment du nettoyage, soyez extremement prudent avec vos motifs. Le blanchiment des 
donnees en utilisant des expressions regulieres represente le seul mecanisme interne ap- 
prouve pour nettoyer de sales donnees. Et parfois, cette approche est entierement mau- 
vaise. Si vous etes en mode de marquage car vous tournez avez set-id et non parce que 
vous avez intentionnellement active -T, vous pouvez limiter les risques en lancant avec 
fork un fils avec des privileges moindres ; voir la section Nettoyage de votre environne- 
ment. 

Le pragma use re 'taint' desactive le nettoyage implicite de toutes les correspondan- 
ces de motifs jusqu'a la fin de la portee lexicale courante. Vous pourriez utiliser ce prag- 
ma si vous vouliez seulement extraire quelques sous-chaines d'une donnee 
potentiellement marquee ; mais puisque ne vous etes pas inquiete de la securite, vous 
feriez mieux de laisser les sous-chaines marquees pour vous preserver des accidents mal- 
chanceux a venir. 

Imaginez que vous trouviez une correspondance avec quelque chose comme ceci, avec 
$chemin_complet marque : 

($rep, $fichier) = $chemin_complet =~ m! (.*/)(.*) !s; 

Par defaut, $rep et $f ichier seraient maintenant marques. Mais vous ne vouliez proba- 
blement pas faire cela de maniere si cavaliere car vous n'avez jamais vraiment ref lechi 
aux problemes de securite. Par exemple, vous ne seriez pas follement heureux si $fi- 
chier contenait la chame « ; rm -rf * ;», pour ne citer qu'un exemple tout a fait re- 
marquable. Le code suivant laisse les deux variables renvoyees marquees si 
$chemin_complet l'etait : 



4. A moins que vous n'utilisiez intentionnellement des locales corrompues. Perl presuppose 
que les definitions de locales de votre systeme sont potentiellement compromises. Ainsi, lorsque 
le pragma use locale est actif, les motifs contenant une classe de caracteres symbolique, comme 
\\w ou [ [: alpha :] ], produisent des resultats marques. 
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{ 

use re 'taint'; 

($rep, $fichier) = $chemin_complet =~ m! (.*/)(.*)! s; 

} 

Une bonne strategic consiste a laissez les sous-correspondances marquees par defaut 
dans le fichier source entier et de ne permettre d'enlever le marquage que selectivement 
dans des portees imbriquees si le besoin s'en fait sentir : 

use re 'taint'; 

# le reste du fichier laisse maintenant $1, etc. marques 
{ 

no re 'taint'; 

# ce bloc enleve maintenant le marquage dans les 

# correspondances d'expressions regulieres 
if ($num =~ / A (\d+)$/) { 

$num = $1; 

} 

} 

Une entree depuis un handle de fichier ou de repertoire est automatiquement mar- 
quee, sauf si elle provient du handle de fichier special DATA. Si vous le souhaitez, vous 
pouvez designer d'autres handles comme des sources dignes de confiance via la fonction 
untaint du module 10: : Handle : 

use 10: :Handle; 

10: :Handle: :untaint(*UN_HF); # Soit de maniere procedurale 
UN_HF->untaint(); # soit en utilisant un style 00. 

Desactiver le marquage sur un handle de fichier complet est un geste dangereux. Com- 
ment savez-vous vraiment qu'il est sur ? Si vous vous appretez a faire cela, vous devriez 
au moins verifier que personne a part le proprietaire ne puisse ecrire dans le fichier. 5 Si 
vous etes sur un systeme de fichiers Unix (et un qui restreint prudemment chown(2) au 
super-utilisateur), le code suivant fonctionne : 

use File: :stat; 

use Symbol 'qualify_to_ref ' ; 

sub handle_semble_sur(*) { 

my $hf = qualify_to_ref (shift, caller); 

my $info = stat($hf); 

return unless $info; 

# le proprietaire n'est ni le super-utilisateur, ni « moi », 

# dont l'uid reel est dans la variable $< 
if ($info->uid != 0 && $info->uid != $<) { 

return 0; 

} 



5. Bien que vous puissiez egalement enlever le marquage d'un handle de repertoire, cette fonc- 
tion ne marche que sur un handle de fichier. Car, etant donne un handle de repertoire, il n'existe 
pas de maniere portable d'extraire son descripteur de fichier avec stat. 
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# verifie si le groupe ou les autres peuvent ecrire dans le fichier 

# utilise 066 pour detecter egalement la possibility de lire 
if ($info->mode & 022) { 

return 0; 

} 

return l; 

} 

use 10: :Handle; 

UN_HF->untaint() if handle_semble_sur(*UN_HF); 

Nous avons appele stat sur le handle de fichier et non sur le nom de fichier pour eviter 
une situation de concurrence (race condition) dangereuse. Voir la section Gestion des si- 
tuations de concurrence plus loin dans ce chapitre. 

Remarquez que cette routine n'est qu'un bon point de depart. Un version legerement 
plus paranoiaque aurait egalement verifier tous les repertoires parents, meme si vous 
ne pouvez pas faire un stat sur un handle de repertoire de maniere fiable. Mais si Fun 
des repertoires parents est en ecriture pour tout le monde, vous savez que vous etes en 
danger qu'il y ait ou non des situations de concurrence. 

Perl a ses propres notions en ce qui concerne les operations qui sont dangereuses mais 
il est toujours possible de se plonger dans les ennuis avec d'autres operations qui se mo- 
quent d'utiliser ou non des valeurs marquees. II ne suffit pas toujours d'etre prudent 
avec les entrees. Les fonctions de Perl pour les sorties ne testent pas si leurs arguments 
sont marques ou non, mais, dans certains environnements, cela compte. Si vous ne fai- 
tes pas attention a ce que vous ecrivez en sortie, vous pourriez tout bonnement finir par 
cracher des chaines ayant une signification inattendue pour quiconque traitant la sortie. 
Si vous tournez sur un terminal, les sequences d'echappement speciales et les codes de 
controle pourraient provoquer un affichage erratique sur le terminal. Si vous etes dans 
un environnement web et que vous recrachez sans precaution tout ce que Ton vous don- 
ne, vous pourriez produire de maniere imprevisible des balises HTML qui deforme- 
raient drastiquement Fapparence de la page. Pire encore, certaines balises peuvent 
meme en retour executer du code dans le navigateur. 

Imaginez le cas courant d'un livre d'or ou les visiteurs entrent leurs propres messages a 
afficher lorsque d'autres viennent appeler. Un invite malicieux pourrait fournir des ba- 
lises HTML disgracieuses ou mettre des sequences <SCRIPT>. . .</SCRIPT> executant du 
code (comme du JavaScript) en retour dans le navigateur des visiteurs suivants. 

Tout comme vous avez verifie que tous les caracteres sont autorises, lorsque vous recevez 
une donnee marquee qui pourrait acceder aux ressources de votre systeme, vous pouvez 
effectuer une verification analogue dans un environnement web lorsque vous recevez 
des donnees d'un internaute. Par exemple, pour supprimer tous les caracteres absentes 
de la liste des bons caracteres, essayez quelque chose comme : 

$nouvelle_entree_du_livre_d_or =~ tr[_a-zA-Z0-9 , . ! ?()@+*-] [ ]dc; 

Vous n'utiliseriez certainement pas cela pour nettoyer un nom de fichier, puisque vous 
ne voulez probablement pas de noms de fichiers avec des espaces ou des slashes, pour 
commencer. Mais il n'est pas suffisant de preserver votre livre d'or vierge de toute balise 
HTML sournoise et de toute entite perfide. Chaque cas de blanchiment de donnee est 
quelque peu different, passez done toujours du temps a decider ce qui est permis et ce 
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qui ne Test pas. Le mecanisme de marquage est prevu pour intercepter les erreurs stupi- 
des, pas pour se dispenser de ref lechir. 

Nettoyage de votre environnement 

Lorsque vous executez un autre programme depuis votre script Perl, peu importe com- 
ment, Perl verifie pour s'assurer que votre variable d'environnement PATH soit securi- 
see. Puisqu'il provient de votre environnement, votre PATH commence par etre marque, 
ainsi si vous essayez de lancer un autre programme, Perl leve une exception « Insecure 
$ENV{PATH} ». Lorsque vous le positionnez a une valeur connue, non marquee, Perl s'as- 
sure que chaque repertoire dans ce PATH ne soit pas accessible en ecriture par quelqu'un 
d'autre que le proprietaire et le groupe du repertoire ; sinon, Perl lance une exception 
« Insecure directory ». 

Vous seriez surpris d'apprendre que Perl se preoccupe de votre PATH meme lorsque vous 
specifiez le nom de chemin complet de la commande que vous voulez executer. II est 
vrai qu'avec un nom de fichier absolu, le PATH n'est pas utilise pour localiser l'executable. 
Mais Perl se merle de ce que le programme execute pourrait en lancer un autre avec un 
PATH non stir. Perl vous force done a positionner un PATH securise avant d'appeler un 
autre programme, quelle que soit la maniere dont vous l'appelez. 

Le PATH n'est pas la seule variable d'environnement pouvant causer du chagrin. Comme 
certains shells utilisent les variables IFS, CDPATH, ENV et BASH_ENV, Perl s'assure que toutes 
celles-ci sont soit vides, soit sans marquage avant de lancer une autre commande. Posi- 
tionnez ces variables a quelque chose que Ton sait etre stir ou alors supprimez-les de 
l'environnement : 

delete EIW{qw(IFS CDPATH ENV BASH_ENV)}; # Rend %ENV plus sur 

Des fonctionnalites accommodantes dans un environnement normal peuvent devenir 
des problemes de securite dans un environnement hostile. Meme si vous vous rappelez 
avoir interdit les noms de fichiers contenant des sauts de ligne, il est important de com- 
prendre que open accede a autre chose de plus que seulement des noms de fichiers. Avec 
les ornements appropries dans l'argument representant le nom de fichier, les appels a 
open avec un ou deux arguments peuvent egalement lancer des commandes arbitraires 
externes via des pipes, « forker » des copies supplementaires du processus courant, du- 
pliquer des descripteurs de fichiers et interpreter le nom de fichier special « - » comme 
un alias de l'entree ou de la sortie standard. II peut egalement ignorer les espaces au de- 
but ou a la fin qui peuvent masquer de tels argument fantaisistes a vos motifs de test. 
Bien qu'il soit vrai que les verifications de marquage de Perl intercepteront les argu- 
ments marques utilises dans les ouvertures de pipe (sauf si vous utilisez un argument de 
liste separe) et toutes les ouvertures de fichiers qui ne soient pas en lecture seule, l'ex- 
ception levee par ceci est toujours susceptible de faire que votre programme se conduise 
mal. 

Si vous avez l'intention d'utiliser une donnee derivee de l'exterieur dans une partie d'un 
nom de fichier a ouvrir, incluez au moins un mode explicite separe par un espace. Ce- 
pendant, le plus sur est certainement d'utiliser un sysopen de bas niveau ou la forme a 
trois arguments de open : 

# Ouverture magique --- peut etre n'importe quoi 

open(HF, $fichier) or die "open $fichier magique, impossible : $!"; 



534 



Chapitre 23 — Securite 



# Garantit l'ouverture cFun fichier en lecture seule et non un pipe 

# ou un fork, mais interprete toujours les descripteurs de 

# fichiers et « - » et ignore les espaces aux extremites du nom. 
open(HF, "< $fichier) or die "open $fichier, impossible : $!"; 

# Ouverture WYSIWYG : desactive toutes les fonctionnalites accommodantes. 
open(HF, "<", $fichier) or die "open $fichier, impossible : $!"; 

# Memes proprietes que la version a 3 arguments WYSIWYG, 
require Fcntl; 

sysopen(HF, $fichier, ORDONLY) or die "sysopen $fichier, impossible : $!"; 

Et mime ces etapes ne sont pas assez bonnes. Perl ne vous empeche pas d'ouvrir des 
noms de fichiers marques en lecture, vous devez done etre prudent avec ce que vous 
montrez aux gens. Un programme qui ouvre en lecture un nom de fichier arbitraire, 
fourni par l'utilisateur, pour ensuite reveler le contenu de ce fichier, est toujours un pro- 
blems de securite. Que se passe-t-il s'il s'agit d'une lettre privee ? Et s'il s'agit du fichier 
de mots de passe de votre systeme ? Ou des informations sur les salaires ou votre porte- 
feuille d'actions ? 

Examinez de pres les noms de fichier fournis par un utilisateur potentiellement hostile 6 
avant de les ouvrir. Par exemple, vous pourriez vouloir verifier qu'il n'y a pas de reper- 
toires soumois dans votre PATH. Les noms comme « ../../../../../../. ./etc/ 
passwd » sont des coups fourres du genre qui sont de notoriete publique. Vous pouvez 
vous proteger en vous assurant qu'il n'y a pas de slash dans le nom du chemin (en sup- 
posant qu'il s'agit du separateur de repertoire de votre systeme). Une autre astuce cou- 
rante est de mettre des sauts de ligne ou des points-virgules dans les noms de fichiers qui 
seront interpretes ensuite par de pauvres interpreteurs de commandes simples d'esprit, 
pouvant etre bluffes en commencant une nouvelle commande au beau milieu du nom 
de fichier. C'est pourquoi le mode de marquage deconseille les commandes externes 
non inspectees. 

Acces aux commandes et aux fichiers avec des privileges 
restreints 

La discussion qui suit est relative a des facilites astucieuses concernant la securite sur les 
systemes Unix. Les utilisateurs d'autres systemes peuvent en toute securite (ou plutot en 
toute insecurite) passer ce paragraphe. 

Si vous tournez avec set-id, essayez d'arranger cela, a chaque fois que c'est possible, pour 
que les operations dangereuses soient accomplies avec les privileges de l'utilisateur et 
non ceux du programme. C'est-a-dire qu'a chaque fois que vous allez appeler open, sy- 
sopen, system, des apostrophes inverses et tout autre operation sur un fichier ou sur un 
processus, vous pouvez vous protegez en repositionnant votre UID ou votre GID effectif 
avec l'UID ou le GID reel. En Perl, vous pouvez faire cela pour les scripts setuid en ecri- 
vant $> = $< (ou $EUID = $UID si vous avez fait use English) et pour les scripts setgid 
en ecrivant $( = $) ($EGID = $GID). Si les deux ID sont positionnes, vous devez reini- 



6. Et sur le Net, les seuls utilisateurs que vous pouvez en toute confiance considerer comme 
n'etant pas potentiellement hostiles sont plutot ceux qui sont activement hostiles. 
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tialiser les deux. De toute facon, c'est parfois infaisable car vous pourriez encore avoir 
besoin de ces privileges accrus ulterieurement dans votre programme. 

Pour ces cas-la, Perl procure un moyen relativement sur d'ouvrir un fichier ou un pipe 
depuis un programme set-id. Tout d'abord, lancez un fils avec la syntaxe speciale de open 
qui connecte le pere et le fils par un pipe. Dans le fils, repositionnez ensuite ses ID d'uti- 
lisateur et de groupe a leur valeur originale ou a des valeurs connues et sures. Vous de- 
vrez egalement modifier tous les attributs de processus du fils sans affecter le pere, vous 
permettant de changer le repertoire de travail courant, positionner le masque de crea- 
tion de fichiers ou bricoler les variables d'environnement. Le processus fils, qui ne s'exe- 
cute plus sous des privileges accrus, appelle finalement open et passe les donnees 
auxquelles il a accede sous couvert d'un utilisateur ordinaire mais dement, a son pere, 
puissant mais paranoi'aque de maniere justifiee. 

Bien que system et exec n'utilisent pas le shell lorsque vous leur fournissez plus d'un 
argument, l'operateur apostrophes inverses n'admet pas de telle convention d'appel al- 
ternative. En utilisant la technique lancant un processus fils, nous pouvons facilement 
emuler les apostrophes inverses sans nous soucier des sequences d'echappements du 
shell et avec des privileges reduits (et done plus surs) : 

use English; # pour employer $UID, etc. 

die "open fork impossible : $!" 

unless defined ($pid = open(DEPUIS_FILS, "-|")); 
if ($pid) { # pere 

while (<DEPUIS_FILS>) { 
# faire quelque chose 

} 

close DEPUIS_FILS; 
} else { 

$EUID = $UID; # setuid(getuid()) 

$EGID = $GID; # setgid(getgid()) et initgroups(2) sur getgroups(2) 

chdir('7") or die "chdir a / impossible : $!"; 

umask(077); 

$ENV{PATH} = "/bin:/usr/bin"; 
exec 'mon prog- 1 , 'argl', 'arg2'; 
die "exec mon_prog impossible : $!"; 

} 

II s'agit du meilleur moyen, et de loin, d'appeler un programme depuis un script set-id. 
Vous etes sur de ne pas utiliser le shell pour executer quoi que ce soit et vous abandon- 
nez vos privileges avant d'appeler vous-meme exec pour lancer le programme. (Mais 
puisque les formes avec liste de system, exec et open sur un pipe sont specifiquement 
exemptes des verifications de marquage, vous devez toujours prendre garde a ce que 
vous leur passez.) 

Si nous n'avez pas besoin d'abandonner vos privileges et voulez seulement implementer 
les apostrophes inverses ou un open sur un pipe sans risquer que le shell intercepte vos 
arguments, il vous suffit d'utiliser ceci : 

open(DEPUIS_FILS, "-|") or exec("mon_prog", "argl", "arg2") 
or die "impossible de lancer monprog : $!"; 

puis de lire dans DEPUIS_FILS dans le pere. Avec la version 5.6.1 de Perl, vous pouvez 
l'ecrire comme ceci : 
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open(DEPUIS_FILS, "-|", "mon_prog", "argl", "arg2"); 

La technique consistant a lancer un fils n'est pas seulement utile pour lancer des com- 
mandes depuis un programme set-id. Elle s'avere egalement bonne pour ouvrir des fi- 
chiers sous FID de quiconque a lance le programme. Imaginez que vous avez un 
programme setuid qui a besoin d'ouvrir un fichier en ecriture. Vous ne voulez pas lan- 
cer le open avec vos privileges supplementaires mais vous ne pouvez pas non plus les 
abandonner definitivement. Arrangez-vous alors pour avoir une copie « forkee » qui 
abandonne ses privileges pour effectuer le open pour vous. Lorsque vous voulez ecrire 
dans le fichier, ecrivez au fils et ce dernier ecrira dans le fichier a votre place. 

use English; 

defined ($pid = open(ECRIVAIN_SUR, "|-")) 
or die "fork impossible : $!"; 

if ($pid) { 

# Vous etes dans le pere. 

# Ecrivez les donnees au fils ECRIVAINSUR. 
print ECRIVAIN_SUR "donnes_en_sortie\n"; 
close ECRIVAIN_SUR 

or die $! ? "Erreur systeme en fermant ECRIVAIN_SUR : $!" 
: "Statut d'attente $? depuis ECRIVAIN_SUR"; 

} else { 

# Vous etes dans le fils. 

# Abandonnez done vos privileges supplementaires. 
($EUID, $ECID) = ($UID, $GID); 

# Ouvrez le fichier avec les droits de l'utilisateur original. 
open(HF, ">/un/chemin/de/fichier" 

or die "open /un/chemin/de/fichier en ecriture, impossible : $!"; 

# Copiez depuis le pere (maintenant stdin) vers le fichier. 
while (<STDIN>) { 

print HF, $_; 

} 

close(HF) or die "Echec de close : $!"; 

exit; # N'oubliez pas de faire disparaitre ECRIVAIN_SUR. 

} 

Lorsqu'il echoue dans l'ouverture du fichier, le fils affiche un message d'erreur et se ter- 
mine. Lorsque le pere ecrit dans le handle de fichier du fils maintenant decede, cela de- 
clenche un signal de pipe brise (SICPIPE) qui est fatal s'il n'est pas intercepte ou ignore. 
Voir la section Signaux au chapitre 16, Communication interprocessus. 

Gestion des problemes de synchronisation 

Parfois, le comportement de vos programmes est tres sensible a la synchronisation 
d'evenements exterieurs hors de votre controle. II s'agit toujours d'un probleme lorsque 
d'autres programmes, particulierement ceux qui sont inamicaux, pourraient se battre 
avec votre programme pour les memes ressources (comme des fichiers ou des periphe- 
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riques). Dans un environnement multitache, vous ne pouvez pas predire l'ordre dans 
lequel les processus en attente d'activation vont etre autorises a acceder au processeur. 
Les flux d'instructions parmi tous les processus eligibles s'entrecroisent, ainsi un proces- 
sus dispose tout d'abord d'un peu de CPU, ensuite un autre, et ainsi de suite. II semble 
aleatoire de savoir celui dont c'est le tour d'etre actif et combien de temps il sera autorise 
a l'etre. Avec un seul programme, il n'y a pas de probleme mais avec plusieurs, parta- 
geant des ressources communes, cela peut en etre un. 

Les programmeurs de « threads » sont particulierement sensibles a ces questions. lis ap- 
prennent vite a ne plus ecrire : 

$var++ if $var == 0; 

lorsqu'ils veulent dire : 

{ 

lock($var); 

$var++ if $var == 0; 

} 

Le premier exemple donne des resultats imprevisibles lorsque plusieurs threads d'exe- 
cution tente de lancer ce code en meme temps. (Voir le chapitre 17, Threads.) Si vous 
pensez aux fichiers comme a des objets partages et aux processus comme a des threads 
candidats pour faeces a ces objets partages, vous pourrez voir comment les memes ques- 
tions sont soulevees. Un processus, apres tout, n'est en realite qu'un thread qui s'y croit. 
Ou vice versa. 

L'imprevisibilite des synchronisations affecte a la fois les situations privilegiees et celles 
qui ne le sont pas. Nous decrirons tout d'abord comment se debrouiller avec un bogue 
de longue date dans les anciens noyaux Unix affectant tous les programmes set-id. Nous 
irons ensuite discuter des situations de concurrence en general, comment elles se trans- 
formed en breches de securite et les etapes que vous devez suivre pour eviter de tomber 
dans ces trous. 

Bogues de securite du noyau Unix 

Au-dela des problemes evidents decoulant du passage de privileges speciaux a des inter- 
preters aussi souples et impenetrables que les shells, les anciennes versions d'Unix 
souffrent d'un bogue du noyau qui rend tout script set-id non sur avant meme d'arriver 
jusqu'a l'interpreteur. Le probleme ne reside pas dans le script lui-meme mais dans une 
situation de concurrence dans ce que fait le noyau lorsqu'il trouve un script set-id exe- 
cutable. (Le bogue n'existe pas sur les machines qui ne reconnaissent pas #! dans le 
noyau.) Entre le moment oil le noyau ouvre un tel fichier pour savoir quel interpreteur 
lancer et celui ou l'interpreteur (maintenant set-id) demarre et ouvre a nouveau le fi- 
chier, il existe une chance pour des entites malicieuses de changer le fichier en question, 
surtout si le systeme implemente les liens symboliques. 

Heureusement, cette « caracteristique » du noyau peut parfois etre desactivee. Malheu- 
reusement, il existe deux moyens pour ce faire. Le systeme peut rendre hors-la-loi les 
scripts avec les bits set-id positionnes, ce qui n'est pas d'une grande aide. II peut egale- 
ment ignorer les bits set-id sur les scripts. Dans ce dernier cas, Perl peut emuler les me- 
canismes de setuid et de setgid quand il remarque les bits set_id (par ailleurs inutiles) 
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sur les scripts Perl. II effectue ceci grace a un executable special appele suidperl, qui est 
automatiquement appele pour vous si besoin. 7 

Cependant, si la fonctionnalite du noyau concernant les scripts set-id n'est pas desacti- 
vee, Perl se plaint bruyamment de ce que le script n'est pas sur. Vous devrez soit la de- 
sactiver, soit enrober le script dans un programme C. II s'agit seulement d'un 
programme compile qui ne fait rien d'autre qu'appeler votre programme Perl. Les pro- 
grammes compiles ne sont pas sujets au bogue qui tourmente les scripts set-id. 

Voici un simple enrobage ecrit en C : 

#define VRAI_FICHIER "/chemin/du/script" 
main(ac, av) 
char **av; 

{ 

execv(VRAI_FICHIER, av); 

} 

Compilez cet enrobage en un executable binaire et rendez-fe set-id au lieu de le faire sur 
votre script. Assurez-vous d'employer un nom de chemin absolu, car le C n'est pas assez 
malin pour verifier le marquage sur votre PATH. 

(Une autre approche possible consiste a employer le generateur experimental de code 
C du compilateur Perl. Un image compilee de votre script ne connaitra pas la situation 
de concurrence. Voir au chapitre 18, Compiler.) 

Ces dernieres annees, certains fournisseurs ont finalement sorti des systemes liberes de 
ce bogue de set-id. Sur de tels systemes, lorsque le noyau passe le nom du script set-id a 
l'interpreteur, il ne s'agit plus d'un nom de fichier sujet a des interventions, mais d'un 
fichier special representant le descripteur de fichier, comme /dev/fd/3. Ce fichier special 
est deja ouvert sur le script de maniere a ce qu'il ne puisse plus avoir de situation de con- 
currence que des scripts diaboliques pourraient exploiter. 8 La plupart des versions mo- 
dernes d'Unix emploient cette approche pour eviter la situation de concurrence 
inherente a l'ouverture d'un meme fichier deux fois. 

Gestion des situations de concurrence 

Ce qui nous amene directement au theme des situations de concurrence. Que sont-elles 
reellement ? Les situations de concurrence se retrouvent frequemment dans les discus- 
sions a propos de la securite. (Bien qu'on les retrouvent moins que dans les programmes 
non surs. Malheureusement.) C'est parce qu'elles sont une source fertile d'erreurs sub- 
tiles de programmation et que de telles erreurs peuvent souvent se transformer en ex- 
ploits (terme poli pour designer le fait de bousiller la securite de quelqu'un) pour la 



7. Si besoin et si c'est permis — si Perl detecte que le systeme de fichiers dans lequel reside le 
script a ete monte avec l'option nosuid, cette derniere sera toujours respectee. Vous ne pouvez 
pas utiliser Perl pour coutourner de cette facon la politique de securite de votre administrateur 
systeme. 

8. Sur ces systemes, Perl doit etre compile avec -DSETUID_SCRIPTS_ARE_SECURE_N(M Le pro- 
gramme Configure qui compile Perl essaie de deviner cette situation, ce qui fait que vous ne 
devriez jamais le specifier explicitement. 
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securite. Une situation de concurrence arrive lorsque le resultat de plusieurs evene- 
ments correles depend de l'ordre de ces evenements mais que cet ordre ne peut etre ga- 
ranti a cause des effets d'une synchronisation non deterministe. Chaque evenement se 
precipite pour etre le premier accompli et l'etat final du systeme est laisse a l'imagina- 
tion de chacun. 

Imaginez que vous ayez un processus ecrivant par dessus un fichier existant et un autre 
processus lisant le meme fichier. Vous ne pouvez predire si vous lisez les anciennes don- 
nees, les nouvelles ou un melange aleatoire des deux. Vous ne pouvez meme pas savoir 
si vous avez lu toutes les donnees. Le lecteur pourrait avoir gagne la course jusqu'a la fin 
du fichier avant de se terminer. En meme temps, si l'ecrivain a continue apres que le 
lecteur a rencontre la fin de fichier, le fichier aura grossi plus loin que Fendroit oil le 
lecteur s'etait arrete et ce dernier ne l'aura jamais su. 

Ici, la solution est simple : il suffit que les deux parties verrouillent le fichier avec flock. 
Le lecteur demande generalement un verrou partage et l'ecrivain un verrou exclusif. 
Tant que toutes les parties demandent et respectent ces verrous consultatifs, les lectures 
et ecritures ne peuvent pas s'enchevetrer et il n'y aucun chance de trouver des donnees 
mutilees. Voir la section Verrouillage de fichier au chapitre 16. 

Vous risquez de rencontrer une forme bien moins evidente de situation de concurrence 
chaque fois que vous laissez des operations sur des noms de fichier gouverner les opera- 
tions ulterieures sur ce fichier. Lorsqu'on les utilise sur des noms de fichier plutot que 
sur des descripteurs de fichier, les operateurs de test de fichier representent parfois un 
terrain fertile menant droit a une situation de concurrence. Considerez ce code : 

if (-e $fichier) { 

open(HF, "< $fichier") 

or die "impossible d'ouvrir $fichier en lecture : $!"; 

} else { 

open(HF, "> $fichier") 

or die "impossible d'ouvrir $fichier en ecriture : $!"; 

} 

Le code parait aussi simple qu'il ne Test, mais il est toujours sujet a des situations de con- 
currence. II n'y a aucune garantie que la reponse renvoyee par le test -e soit toujours 
valide au moment ou l'un des open est appele. Dans le bloc if, un autre processus pour- 
rait avoir supprime le fichier avant qu'il ne puisse etre ouvert et vous ne trouveriez pas 
le fichier dont vous pensiez qu'il allait se trouver la. Dans le bloc else, un autre proces- 
sus pourrait avoir cree le fichier avant que le tour du second open n'arrive pour qu'il 
puisse le creer et le fichier que vous pensiez done ne pas etre la, le serait. La simple fonc- 
tion open cree de nouveaux fichiers mais ecrase ceux qui existaient. Vous pouvez penser 
que vous voulez ecraser tout fichier existant mais penser que le fichier existant pourrait 
tres bien etre un alias nouvellement cree ou un lien symbolique vers un fichier autre 
part sur le systeme que vous ne voudriez vraiment pas ecraser. Vous pouvez penser que 
vous savez ce que signifie un nom de fichier a n'importe quel instant mais vous ne pou- 
vez jamais en etre vraiment sur, tant que d'autres processus ayant acces au repertoire du 
fichier tournent sur le meme systeme. 

Pour resoudre ce probleme d'ecrasement, vous devrez employer sysopen, qui fournit 
des controles individuels pour soit creer un nouveau fichier, soit pour en ecraser com- 
pletement un qui existe. Et nous abandonnerons ce test -e d'existence de fichier puis- 
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qu'il n'est plus utile ici et ne fait qu'accroitre notre exposition aux situations de 
concurrence. 

use Fcntl qw/0_WR0NLY OCREAT OEXCL/; 

open (HF, "<", $fichier) 

or sysopen(HF, $fichier, 0_WR0NLY | 0_CREAT | 0_EXCL) 

or die "impossible de creer le nouveau fichier $fichier : $!"; 

Maintenant, meme si le fichier se met a eclore d'une maniere ou d'une autre entre le 
moment ou le open echoue et celui ou le sysopen essaie d'ouvrir un nouveau fichier en 
ecriture, aucun mal ne peut etre fait car avec les flags que nous lui avons fournis, syso- 
pen refusera d'ouvrir un fichier qui existe deja. 

Si quelqu'un essaie de persuader par la ruse votre programme de mal se conduire, il a 
une bonne chance de reussir en faisant apparaitre et disparaitre les fichiers quand vous 
ne vous y attendez pas. Un moyen de reduire le risque de tromperie consiste a vous pro- 
mettre a vous-meme que vous ne manipulerez jamais un nom de fichier plus d'une fois. 
Des que vous avez ouvert le fichier, oubliez son nom (a part peut-etre pour les messages 
d'erreur) et ne manipulez plus que le handle representant le fichier. C'est beaucoup plus 
sur car, meme si quelqu'un pourrait s'amuser avec vos noms de fichier, il ne peut le faire 
avec les handles. (Ou s'il le peut, c'est parce que vous l'avez laisse faire — voir Passage de 
handles de fichiers au chapitre 16.) 

Plus haut dans ce chapitre, nous avons presente une fonction handle_semble_sur qui 
appelait la fonction stat de Perl sur un handle de fichier (et non un nom de fichier) 
pour verifier son appartenance et ses permissions. L'emploi du handle de fichier est cri- 
tique pour l'exactitude de la solution — si nous avions passe le nom du fichier, il n'y 
aurait eu aucune garantie que le fichier dont nous examinions les attributs ait ete le 
meme que celui que nous venions d'ouvrir (ou que nous etions sur le point d'ouvrir). 
Un minable mecreant aurait pu supprimer notre fichier et le remplacer rapidement par 
un fichier subversif, a un moment donne entre le stat et le open. Peut importe lequel 
aurait ete appele en premier ; il y aurait toujours une opportunite pour un jeu deloyal 
entre les deux. Vous pouvez penser que le risque est tres reduit puisque la fenetre Test 
aussi mais il existe de nombreux scripts pirates dans le monde qui seraient tout a fait 
heureux de lancer votre programme des milliers de fois pour s'en jouer la seule fois oil 
il n'a pas ete assez prudent. Un script pirate habile peut meme baisser la priorite de votre 
programme pour qu'il soit interrompu plus souvent que d'ordinaire, simplement pour 
accelerer un peu les choses. Les gens travaillent dur sur ces questions — c'est pourquoi 
on les appelle des exploits. 

En appelant stat sur un handle de fichier deja ouvert, nous n'accedons au nom du fi- 
chier qu'une seule fois et evitons ainsi la situation de concurrence. Une bonne strategic 
pour eviter les situations de concurrence entre deux evenements consiste a combiner les 
deux d'une maniere ou d'une autre pour n'en faire qu'un seul evenement, en rendant 
l'operation atomique. 9 Puisque nous n'accedons au fichier qu'une seule fois par son 



9. Oui, vous pouvez encore accomplir des operations atomiques dans une zone denuclearisee. 
Lorsque Democrite a donne le nom « atome » aux parties indivisibles de la matiere, il voulait lit- 
teralement dire quelque chose qui ne peut etre divise : a-(non) + tomos (divisible). Une operation 
atomique est une action qui ne peut etre interrompue. (Essayez seulement d'interrompre un 
jour une bombe atomique.) 
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nom, il ne peut y avoir de situation de concurrence entre plusieurs acces, ainsi ca ne fait 
pas grand chose si le nom change. Meme si notre pirate supprime le fichier que nous 
avons ouvert (oui, cela peut arriver) et le remplace par un autre pour s'amuser avec 
nous, nous avons toujours un handle sur le fichier reel et original. 

Fichiers temporaires 

A part autoriser les depassements de tampons (ce contre quoi les scripts Perl sont vir- 
tuellement immunises) et faire confiance a des donnees en entree indignes de confiance 
(ce contre quoi le mode de marquage preserve), creer de maniere incorrecte des fichiers 
temporaires est l'un des trous de securite les plus frequemment exploites. Heureuse- 
ment, les attaques contre les fichiers temporaires exigent des pirates qu'ils aient un 
compte d'utilisateur valide sur le systeme qu'ils tentent de pirater, ce qui reduit drasti- 
quement le nombre de mecreants potentiels. 

Les programmes imprudents ou desinvoltes utilisent des fichiers temporaires avec tou- 
tes sortes de moyens non stirs, comme en les placant dans des repertoires accessibles en 
ecriture par le monde entier, en utilisant des noms de fichier previsibles et en ne s'assu- 
rant pas que le fichier n'existe pas deja. Des que vous trouvez un programme avec du 
code comme ceci : 

open(TMP, ">/tmp/truc.$$") 

or die "impossible d'ouvrir /tmp/truc.$$ : $!"; 

vous venez de trouver les trois erreurs d'un coup. Ce programme est un accident en sursis. 

Le moyen mis en ceuvre par l'exploit consiste pour le pirate a tout d'abord planter un 
fichier du meme nom que celui que vous utiliserez. Ajouter le PID a la fin ne suffit pas 
a garantir l'unicite ; aussi surprenant que cela puisse paraitre, ce n'est vraiment pas dif- 
ficile deviner des PID. 10 Maintenant arrive le programme avec Fappel imprudent a open 
et au lieu de creer un nouveau fichier temporaire pour ses propres besoins, il ecrase ce- 
lui du pirate a la place. 

Quel mal cela peut-il done faire ? Beaucoup ! Le fichier du pirate n'est pas vraiment un 
fichier pur, voyez-vous. C'est un lien symbolique (ou parfois un lien en dur), pointant 
certainement vers un fichier critique dans lequel le pirate ne pourrait normalement pas 
ecrire tout seul, comme /etc/passwd. Le programme pensait avoir ouvert un fichier tout 
neuf dans /tmp mais a la place, il a ecrase un fichier existant quelque part ailleurs. 

Perl offre deux fonctions abordant ce probleme, si elles sont utilisees correctement. La 
premiere est POSIX: :tmpnam, qui ne fait que renvoyer le nom de fichier que vous es- 
comptiez ouvrir par vous-meme : 

# Essaie des noms jusqu'a en obtenir un qui soit tout neuf 
use POSIX; 

do { 

$nom = tmpnamQ; 
} until sysopen(TMP, $nom, 0_RDWR | OCREAT | OEXCL, 0600); 

# Maintenant faites des E/S en utilisant le handle TMP. 



10. Sauf si vous etes sur un systeme comme OpenBSD, qui affecte de nouveaux PID de maniere 
aleatoire. 
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La seconde est 10: : FILE : : new_tmpfile, qui vous redonne un handle deja ouvert : 

# Ou sinon laissez le module le faire a votre place, 
use 10: : File; 

my $hf = 10: :File: :new_tmpfile(); # II s'agit de tmpfile(3) de POSIX 

# Maintenant faites des E/S en utilisant le handle $hf . 

Aucune des deux approches n'est parfaite, mais entre les deux, la premiere est la 
meilleure. Le probleme majeur avec la seconde est que Perl est tributaire des faiblesses 
de l'implementation de tmpfile(3) dans la bibliotheque C de votre systeme et que vous 
n'avez aucune garantie que cette fonction ne fasse pas quelque chose d'aussi dangereux 
que le open que nous essayons de corriger. (Et c'est le cas, assez tristement, de certaines 
implementations.) Un probleme mineur est que cela ne vous donne pas du tout le nom 
du fichier. Bien que ce soit mieux si vous pouvez manipuler un fichier temporaire sans 
connaitre son nom — car de cette maniere vous ne provoquerez jamais de situation de 
concurrence en essayant de l'ouvrir a nouveau — bien souvent, vous ne pouvez pas. 

Le probleme majeur avec la premiere approche est que vous n'avez aucun controle sur 
Fendroit ou se trouve le chemin du fichier, au contraire de la fonction mkstemp(3) de la 
bibliotheque C. Une premiere raison est qu'il faut eviter de mettre le fichier sur un sys- 
teme de fichiers monte en NFS. II n'est pas garanti que le flag 0_EXCL fonctionne cor- 
rectement sous NFS, plusieurs processus demandant une creation exclusive 
pratiquement au meme moment peuvent done tous reussir. Une autre raison est que le 
chemin renvoye se situe probablement dans un repertoire ou les autres ont les droits en 
ecriture, quelqu'un pourrait avoir plante un lien symbolique pointant vers un fichier 
inexistant, vous forcant a creer votre fichier a un endroit qu'il prefere. 11 Si vous avez vo- 
tre mot a dire la-dessus, ne mettez pas vos fichiers temporaires dans un repertoire oil 
quelqu'un d'autre peut ecrire. Si vous y etes oblige, assurez-vous d'utiliser le flag 0_EXCL 
dans le sysopen et essayez d'employer des repertoires avec le flag « seul-le-proprietaire- 
peut-effacer » (le « sticky bit ») positionne. 

Depuis la version de Perl 5.6.1, il existe une troisieme maniere. Le module standard Fi- 
le: :Temp prend en compte toutes les difficultes que nous avons mentionnees. Vous 
pourriez utiliser les options par defaut ainsi : 

use File::Temp "tempfile"; 
$handle = tempfileQ; 

Ou vous pourriez specifier certaines options ainsi : 

use File::Temp "tempfile"; 

($handle, $nom_f ichier) = tempfile("priseXXXXXX", 

DIR => "/var/spool/aventure", 
SUFFIX = \dat')j 

Le module File: :Temp fournit egalement des emulations se preoccupant de la securite 
pour les autres fonctions que nous avons mentionnees (bien que l'interface native soit 
meilleure car elle vous donne un handle de fichier ouvert et pas seulement un nom de 
fichier, qui est sujet a des situations de concurrence). Voir le chapitre 32, Modules stan- 



11. Une solution a ceci, qui ne fonctionne que sous certains systemes d'exploitation, consiste a 
appeler sysopen en utilisant un OU avec le flag 0_N0F0LL0W. Ceci fait echouer la fonction si le com- 
posant final du chemin est un lien symbolique. 
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dards, pour une plus longue description des options et de la semantique de ce module. 

Une fois que vous avez votre handle de fichier, vous pouvez en faire tout ce que vous 
voulez. II est ouvert a la fois en lecture et en ecriture, vous pouvez done ecrire dans le 
handle, faire un seek pour revenir au debut et ensuite, si vous le voulez, ecraser tout ce 
que vous veniez d'y mettre ou le lire a nouveau. La chose que vous voudrez vraiment, 
vraiment eviter de faire est de jamais ouvrir ce fichier a nouveau, car vous ne pouvez etre 
stirs qu'il s'agisse vraiment du meme fichier que vous aviez ouvert la premiere fois. 12 

Lorsque vous lancez un autre programme depuis votre script, Perl ferme normalement 
pour vous tous les handles de fichiers pour eviter une autre vulnerabilite. Si vous utili- 
sez f cntl pour nettoyer votre flag close-on-exec (comme dans la description d'open au 
chapitre 29, Fonctions), les autres programmes que vous appelez heriteront de ce nou- 
veau descripteur de fichier ouvert. Sur les systemes qui implementent le repertoire 
/dev/fd, vous pourriez fournir a un autre programme un nom de fichier qui soit vrai- 
ment le descripteur de fichier en le construisant de cette facon : 

$nom_virtuel = "/dev/fd" . fileno(TMP); 

Si vous n'aviez besoin que d'appeler un sous-programme Perl ou un programme qui at- 
tend un nom de fichier comme argument et si vous saviez que ce sous-programme ou 
que ce programme l'utilisait avec un open ordinaire, vous pourriez alors passer le han- 
dle de fichier en employant la notation de Perl pour indiquer un handle de fichier : 

$nom_virtuel = "=&" . fileno(TMP); 

Lorsque le « nom » de fichier est passe avec un open ordinaire en Perl a un ou deux ar- 
guments (et non trois, ce qui enleverait toute cette magie bien utile), vous obtenez Fae- 
ces au descripteur duplique. D'une certaine maniere, ceci est plus portable que de passer 
un fichier depuis /dev/fd car cela fonctionne partout ou Perl fonctionne ; tous les syste- 
mes n'ont pas de repertoire /dev/fd. D'un autre cote, la syntaxe speciale d'open en Perl 
pour acceder aux descripteurs de fichiers par des nombres ne fonctionne qu'avec des 
programmes Perl et non avec des programmes ecrits dans d'autres langages. 

Gestion du code non sur 

La verification de marquage n'est qu'une sorte de couverture de survie dont vous avez 
besoin si vous voulez debusquer des donnees fausses que vous auriez du deceler vous- 
meme mais que vous n'avez pas pu depister avant de les abandonner au systeme. C'est 
un peu comme les avertissements optionnels que Perl peut vous donner — ils peuvent 
ne pas indiquer de probleme reel mais en moyenne le mal que Fon se donne a gerer les 
fausses alertes est moindre que celui de ne pas detecter les vrais problemes. Avec le mar- 
quage, ce dernier mal est encore plus insistant car Futilisation de donnees fausses ne 
donne pas seulement les mauvaises reponses ; cela peut saccager votre systeme et vos 
deux dernieres annees de travail avec. (Et peut-etre vos deux prochaines si vous n'avez 
pas fait de bonnes sauvegardes.) Le mode de marquage est utile lorsqu'il s'agit d'avoir 



12. Excepte apres coup, en faisant un stat sur les deux handles de fichiers et en comparant le 
deux premieres valeurs renvoyees pour chacun (la paire peripherique/inode). Mais c'est trop tard 
car le mal est deja fait. Tout ce que vous pouvez faire est de constater les degats et d'abandonner 
(et peut-etre envoyer furtivement un email a l'administrateur systeme). 
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confiance en vous-meme pour ecrire du code honnete mais ne que vous ne faites pas 
systematiquement confiance a quiconque vous passe des donnees pour ne pas essayer 
de vous pousser a faire quelque chose de regrettable. 

Les donnees sont une chose. Mais c'est tout a fait une autre affaire lorsque vous ne pou- 
vez meme pas faire confiance au code que vous etes en train d'executer. Et si l'applet que 
vous avez recuperee sur le Net contenait un virus, une bombe a retardement ou un che- 
val de Troie ? La verification de marquage est ici inutile car, alors que les donnees qui 
sont fournies au programme peuvent etre tres bien, c'est le code qui est indigne de con- 
fiance. Vous vous mettez dans la situation de quelqu'un qui recoit un appareil myste- 
rieux de la part d'un etranger, avec une note disant en substance : « Placez ceci contre 
votre crane et appuyez sur la detente. » Vous pouvez penser que cela va secher vos che- 
veux, mais peut-etre plus pour tres longtemps. 

Dans ce domaine, la prudence est synonyme de paranoia. II vous faut un systeme qui 
vous permette de placer le code suspect en quarantaine. II peut continuer a exister et 
meme accomplir certaines fonctions mais vous ne le laissez pas se promener et faire tout 
ce dont il a envie. En Perl, vous pouvez imposer un genre de quarantaine en utilisant le 
module Safe. 

Compartiments securises 

Le module Safe vous laisse mettre en place un bac a sable (sandbox), un compartiment 
special dans lequel toutes les operations systeme sont interceptees et ou Faeces a l'espace 
de noms est strictement controle. Les details techniques de bas niveau de ce module 
sont changeants nous adopterons done ici une approche plus philosophique. 

Restriction de Faeces a l'espace de noms 

Au niveau le plus fondamental, un objet Safe ressemble a un coffre-fort sauf que l'idee 
de base est de laisser les truands a l'interieur et non a l'exterieur. Dans le monde Unix, 
il existe un appel systeme connu sous le nom de chroot(2) qui peut consigner en perma- 
nence un processus dans un sous-repertoire du systeme de fichiers — dans son enfer per- 
sonnel si vous voulez. Une fois que le processus y est installe, il ne peut absolument pas 
atteindre de fichiers a l'exterieur de ce repertoire car il ne sait rien pas nommer de fi- 
chiers se trouvant a l'exterieur. 13 Un objet Safe ressemble a cela mais au lieu d'etre res- 
treint a un sous-ensemble de la structure de repertoires du systeme de fichiers, il est 
restreint a un sous-ensemble de la structure des paquetages de Perl, qui est tout aussi 
hierarchique que la structure du systeme de fichiers. 

Une autre maniere de voir un objet Safe est quelque peu similaire a ces salles d'obser- 
vations avec des miroirs sans tain dans lesquelles la police met ses suspects. Les gens a 
l'exterieur peuvent regarder ceux dans la salle mais non l'inverse. 

Lorsque vous creez un objet Safe, vous pouvez lui donner un nom de paquetage si vous 
le voulez. Sinon, un nouveau nom sera choisi pour vous : 



13. Certains sites font cela pour executer des scripts CGI, en utilisant des montages en boucle et 
en lecture seule. C'est quelque peu ennuyeux a configurer mais si quelqu'un s'echappe un jour, il 
decouvrira qu'il n'a nulle part oil aller. 
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use Safe; 

my $salle = Safe->new("Donjon"); 

$Donjon: :truc = 1; # Pourtant, l'acces direct est deconseille. 

Si vous qualifiez pleinement les variables et les fonctions utilisant le nom de paquetage 
donne a la methode new, vous pouvez y acceder depuis l'exterieur, du moins dans l'im- 
plementation actuelle. Cela peut toutefois changer, puisque le projet actuel est de do- 
ner la table de symboles dans un nouvel interpreteur. Une solution pouvant etre 
legerement plus compatible consiste a positionner les choses avant de creer l'objet Safe, 
comme montre ci-dessous. Ceci est susceptible de continuer a fonctionner et c'est une 
maniere habile de configurer un objet Safe qui doit demarrer avec beaucoup 
« d'etats ». (Admettons-le, $Donjon: :truc n'a pas beaucoup d'etats.) 

use Safe; 

$Donjon: :truc =1; # L'acces direct est toujours deconseille. 
my $salle = Safe->new("Donjon"); 

Mais Safe fournit egalement un moyen d'acces aux evenements globaux du comparti- 
ment si vous ne connaissez pas le nom de paquetage du compartiment. Ainsi, pour une 
compatibility ascendante maximale (toutefois, la vitesse ne le sera pas, maximale), nous 
vous suggerons d'employez la methode reval : 

use Safe; 

my $salle = Safe->new(); 
$salle->reval( J $truc = 1'); 

(En fait, il s'agit de la meme methode que vous utiliserez pour executer du code sus- 
pect.) Lorsque vous passez du code dans le compartiment pour le compiler et l'executer, 
ce code pense qu'il se trouve vraiment dans le paquetage main. Ce que le monde exte- 
rieur appelle $Donjon: :truc, le code a l'interieur pense qu'il s'agit de $main: :truc ou 
$ : : true ou simplement $truc si use strict n'est pas actif Cela ne marchera pas si Ton 
ecrit $Donjon: :truc a l'interieur du compartiment car ceci accederait en fait a $Don- 
jon: : Donjon: :truc. En donnant a l'objet Safe sa propre notion de main, les variables 
et les sous-programmes dans le reste de votre programme sont proteges. 

Pour compiler et executer du code dans le compartiment, utilisez la methode reval 
(« eval restreint ») en passant une chaine de code comme argument. Comme avec rou- 
te autre construction eval CHAINE, les erreurs a la compilation et les exceptions a l'exe- 
cution pour reval ne tueront pas votre programme. Elles ne feront qu'abandonner le 
reval et laisser l'exception dans $@, assurez-vous done de la verifier apres chaque appel 
a reval. 

En utilisant les initialisations donnees plus tot, ce code affichera que « true vaut main- 
tenant 2 » : 

$salle->reval(-'$truc++; print "true vaut maintenant $main: :truc\n" J ); 
if ($@) { 

die "Impossible de compiler le code dans le compartiment : $@"; 

} 

Si vous ne voulez que compiler du code sans l'executer, enrober votre chaine dans une 
declaration de sous-programme : 

$salle->reval(q{ 
our $truc; 



546 



Chapitre 23 — Securite 



sub affichetruc { 

print "true vaut maintenant $main: :truc\n"; 

} 

}, i); 

die if $@; # verification de la compilation 

Cette fois, nous avons passe a reval un second argument qui, s'il est vrai, indique a re- 
val de compiler le code avec le pragma strict actif. Depuis l'interieur de la chaine de 
code, vous ne pouvez pas desactiver strict car importer et ne pas importer sont juste- 
ment deux des choses que vous ne pouvez pas faire normalement dans un comparti- 
ment Safe. II existe encore beaucoup de choses que vous ne pouvez pas faire 
normalement dans un compartiment Safe — voir le paragraphe suivant. 

Une fois que vous avez cree la fonction af f ichejtruc dans le compartiment, ces instruc- 
tions sont a peu pres equivalentes : 

Ssalle^revalCaffichejtrucO'); # Meilleure facon. 
die if $@; 

$salle->varglob('affiche_truc')->(); # Appel via un glob anonyme. 

Donjon: :affiche_truc(); # Appel direct, fortement deconseille. 

Restriction de Faeces aux operateurs 

L'autre chose importante a propos d'un objet Safe est que Perl limite les operations dis- 
ponibles a l'interieur du bac a sable. (Vous pourriez tres bien laisser votre enfant pren- 
dre un seau et une pelle dans le bac a sable mais vous refuseriez certainement de le 
laisser jouer avec un bazooka.) II ne suffit pas de proteger seulement le reste de votre 
programme ; vous devez aussi proteger le reste de votre ordinateur. 

Lorsque vous compilez du code dans un objet Safe, avec reval ou rdo (la version res- 
treinte de l'operateur do FICHIER), le compilateur consulte une liste speciale, par com- 
partiment, de controle d'acces pour decider si chaque operation individuelle est 
consideree ou non comme sure pour la compilation. De cette maniere vous n'avez pas 
a (trop) vous inquieter a propos des sequences d'echappement imprevues du shell, de 
l'ouverture de fichiers alors que vous ne le vouliez pas, des assertions de code etranges 
dans les expressions regulieres ou de la plupart des problemes d'acces depuis l'exterieur 
que la plupart des gens craignent habituellement. (Ou qu'ils devraient craindre.) 

L'interface specifiant quels operateurs devraient etre permis ou restreints est actuelle- 
ment en cours de reecriture, nous ne montrerons done ici que la maniere d'en utiliser 
un ensemble par defaut. Pour plus de details, consultez la documentation en ligne du 
module Safe. 

Le module Safe n'offre pas une protection complete contre les attaques par saturation 
des serveurs (denial-of-service attacks), particulierement lorsqu'on l'utilise dans ses mo- 
des les plus permissifs. Les attaques par saturation des serveurs prennent toutes les res- 
sources d'un certain type disponibles sur le systeme, empechant les autres processus 
d'acceder aux caracteristiques essentielles du systeme. Des exemples de telles attaques 
comprennent le bourrage de la table de processus du noyau, la main-mise sur la CPU 
en executant dans une frenetique boucle sans fin, l'epuisement de toute la memoire dis- 
ponible et le remplissage d'un systeme de fichiers. Ces problemes sont tres difficiles a 
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resoudre, particulierement de maniere portable. Voir la fin de la section Du code deguise 
en donnees pour une discussion plus approfondie sur les attaques par saturation des ser- 
veurs. 

Exemples securises 

Imaginez que vous ayez un programme CGI gerant un formulaire dans lequel l'utilisa- 
teur peut rentrer une expression Perl arbitraire et recuperer le resultat evalue. 14 Comme 
toutes les entrees venant de l'exterieur, la chaine arrive marquee, Perl ne vous laissera 
done pas encore lui appliquer un eval — vous devrez d'abord la nettoyer grace a une 
reconnaissance de motif. Le probleme est que vous ne serez jamais capables de concevoir 
un motif qui puisse detecter toutes les menaces possibles. Et vous n'oserez pas nettoyer 
ce que vous avez recu et Fenvoyer a l'eval interne. (Si vous osez, nous serons tentes de 
penetrer dans votre systeme pour supprimer le script.) 

C'est ici que reval entre en scene. Voici un script CGI qui traite un formulaire avec un 
simple champ, evalue (dans un contexte scalaire) la chaine qu'il trouve et affiche le re- 
sultat formate : 

#!/usr/bin/perl -lTw 
use strict; 

use CGI::Carp 'fatalsToBrowser' ; 
use CGI qw/: standard escapeHTML/; 
use Safe; 

print header(-type => "text/html;charset=UTF-8"), 
start_html(" Resultat de l'expression Perl"); 

my $expr = param("EXPR") =~ / A ([ A ;]+)/ 

? $1 # renvoie la portion maintenant nettoyee 

: croak("aucun champ EXPR valide dans le formulaire"); 

my $reponse = Safe->new->reval($expr); 

die if $@; 

print p("Le resultat de", tt(escapeHTML($expr)) , 

"est", tt(escapeHTML($reponse))); 

Imaginez qu'un utilisateur malveillant vous passe « print 'cat /etc/passwd ( »(ou pi- 
re) comme chaine d'entree. Grace a l'environnement restreint qui interdit les apostro- 
phes inverses, Perl decelera le probleme a la compilation et quittera immediatement. La 
chaine dans $@ est « quoted execution (", qx) trapped by operation mask » (exe- 
cution entre apostrophes inverses (' ', qx) capturee par le masque des operations), ainsi 
que les informations obligatoires a la fin, identifiant oil le probleme a eu lieu. 

Puisque nous n'avons pas dit le contraire, les compartiments que nous avons crees utili- 
sent tous l'ensemble par defaut d'operations permises. La maniere dont vous vous y pre- 
nez pour declarer des operation specifiques comme permises ou interdites, importe peu 
ici. Et puisque vous pouvez creer plusieurs objets Safe dans votre programme, vous 
pouvez conferer differents degres de confiance aux differents morceaux de code selon 
leur provenance. 



14. Merci de ne pas rire. Nous avons vraiment vu des pages web faire cela. Sans Safe ! 
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Si vous desirez vous amuser avec Safe, void une petite calculatrice interactive en Perl. 
Vous pouvez lui passer des expressions numeriques et voir immediatement leur resul- 
tats. Mais elle n'est pas limitee aux nombres. Elle ressemble plus a l'exemple de boucle 
pour eval au chapitre 29, oil vous pouvez prendre tout ce qu'on vous donne, l'evaluer 
et renvoyer le resultat. La difference est que la version avec Safe n'execute pas aveugle- 
ment tout ce que vous souhaitez. Vous pouvez lancer cette calculatrice interactivement 
sur votre terminal, y taper quelques bouts de code en Perl et verifier les reponses pour 
avoir un apercu des types de protection fournis par Safe. 

#!/usr/bin/perl -w 

# calcsecu - programme de demonstration pour jouer avec Safe 
use strict; 
use Safe; 

my $salle = Safe->new(); 
while (l) { 

print "Entree : "; 

my $expr = <STDIN>; 

exit unless defined $expr; 

chomp($expr); 

print "$expr donne "; 

local $SIG{_wARN_} = sub { die @_ }; 

my $result = $salle->reval($expr, l); 

if ($@ =~ s/at \(eval \d+\).*//) { 

printf "[%s]: "As", $@ =~ /trapped by operation mask/ 
? "Violation de la securite" : "Exception", $(5); 

} else { 

print "[Resultat normal] $result\n"; 

} 

} 

Avertissement : le module Safe est actuellement en cours de re-specification pour exe- 
cuter chaque compartiment dans un interpreteur Perl completement independant 
dans le mime processus. (C'est la strategic employee par le mod_perl d'Apache lorsqu'il 
execute des scripts Perl precompiled.) Les details sont encore vagues en ce moment mais 
notre boule de cristal suggere que designer des choses a Finterieur du compartiment en 
utilisant un paquetage nomme ne vous conduira pas bien loin apres la reecriture immi- 
nente. Si vous utilisez une version de Perl plus recente que 5.6, verifier les notes concer- 
nant la version dans perldata(l) pour voir ce qui a change ou consultez la 
documentation du module Safe lui-meme. (Bien entendu, c'est toujours ce que vous 
faites, n'est-ce pas ?) 

Du code deguiseen donnees 

Les compartiments Safe sont disponibles lorsque des choses vraiment effrayantes arri- 
vent mais cela ne veux pas dire que vous devriez laisser tomber votre garde lorsque vous 
vous occupez chez vous de choses quotidiennes. Vous devez cultiver une vigilance sur ce 
qui vous entoure et regarder les choses du point de vue de quelqu'un voulant s'intro- 
duire. Vous devez prendre des mesures proactives comme garder les choses bien eclai- 
rees et tailler les buissons qui peuvent dissimuler divers problemes se tapissant dans 
l'ombre. 
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Perl essaie de vous aider dans ce domaine egalement. L'analyse conventionnelle et le 
schema d'execution de Perl evitent les pieges dont les langages de programmation shell 
sont souvent la proie. II existe beaucoup de fonctionnalites extremement puissantes 
dans les langages, mais par de par leur conception, ils sont syntaxiquement et semanti- 
quement limites de facon que le programmeur garde le controle. A quelques exceptions 
pres, Perl n'evalue chaque token qu'une seule fois. Quelque chose semblant etre utilise 
comme une variable pour une simple donnee ne s'enracinera pas soudainement quel- 
que part dans votre systeme de fichiers. 

Malheureusement, ce genre de chose peut arriver si vous appelez le shell pour lancer 
d'autres programmes pour vous car vous tournez alors avec les regies du shell a la place 
de celles de Perl. Le shell est cependant facile a eviter — vous n'avez qu'a utiliser les for- 
mes avec un argument de liste pour les fonctions system, exec ou open sur un pipe. Bien 
que les apostrophes inverses ne disposent pas d'une forme avec un argument de liste qui 
soit securisee contre le shell, vous pouvez toujours les emuler comme decrit a la section 
Acces awe commandes et aux fichiers avec des privileges restreints. (Alors qu'il n'y a pas de 
moyen syntaxique pour donner aux apostrophes inverses un argument de liste, une for- 
me a plusieurs arguments de l'operateur readpipe sous-jacent est en cours de 
developpement ; mais au moment ou nous ecrivons ces lignes, elle n'est pas encore pre- 
te pour le devant de la scene.) 

Lorsque vous utilisez une variable dans une expression (y compris lorsque vous l'inter- 
polez dans une chaine entre guillemets), il n'y a aucune chance pour que la variable con- 
tienne du code Perl qui fasse quelque chose auquel vous ne vous attendiez pas. 15 Au 
contraire du shell, Perl n'a jamais besoin de guillemets ou d'apostrophes protecteurs 
autour des variables, peu importe ce qu'elle peuvent contenir. 

$nouveau = $ancien; # pas besoin de guillemets ou d'apostrophes. 

print "$nouveau itemsNn"; # $nouveau ne peut pas vous faire de mal. 

$phrase = "$nouveau items\n"; # ici non plus. 

print $phrase; # toujours parfaitement ok. 

Perl adopte une approche « WYSIWYG » {what you see is what you get, ce que vous voyez 
est ce que vous obtenez). Si vous ne voyez pas de niveau supplementaire d'interpola- 
tion, alors il n'y en a pas. II est possible d'interpoler arbitrairement des expressions Perl 
dans des chaines mais seulement si vous demandez specifiquement a Perl de le faire. (Et 
meme ainsi, le contenu est toujours sujet aux verifications de marquage si vous etes en 
mode de marquage.) 

$phrase = "Vous avez perdu @{[ 1 + int rand(6) ]} points\n"; 

L'interpolation n'est cependant pas recursive. Vous ne pouvez pas cacher une expression 
arbitraire dans une chaine : 

$compteur = '1 + int rand(6)'; # Du code aleatoire. 
$dire = "$compteur points"; # Plutot un litteral. 

$dire = "@{ [$compteur] } points; # Egalement un litteral. 



15. Cela dit, si vous generez une page web, il est possible d'emettre des balises HTML, compre- 
nant du code JavaScript, qui pourrait faire quelque chose auquel le navigateur distant ne s'atten- 
dait pas. 
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Les deux affectations a $dire produiraient « 1 + rand(6) points », sans evaluer le con- 
tenu interpole de $compteur en tant que code. Pour obliger Perl a faire cela, vous devez 
appeler eval CHAINE explicitement : 

$code = '1 + int rand(6)'; 
$lance_de_des = eval $code; 
die if $@; 

Si $code etait marque, cet eval CHAINE aurait leve sa propre exception. Bien entendu, il 
ne faut presque jamais evaluer du code aleatoire provenant de l'utilisateur — mais si 
vous le faites, vous devriez jetez un oeil au module Safe. Vous avez du en entendendre 
parler. 

II existe un endroit oil Perl peut parfois traiter des donnees comme du code ; a savoir, 
lorsque le motif dans un operateur qr//, m// ou si 1 1 contient l'une des nouvelles asser- 
tions des expressions regulieres, (?{ CODE }) ou (??{ CODE }). Celles-ci ne posent pas de 
problemes de securite lorsqu'elles sont utilisees comme des litteraux dans des correspon- 
dances de motifs : 

$cmpt = $n = 0; 

while ($donne =~ /( \d+ (?{ $n++ }) | \w+ )/gx) { 
$cmpt++; 

} 

print "$cmpt mots trouves, dont $n nombres.Nn"; 

Mais du code existant interpolant des variables dans des correspondances a ete ecrit en 
presupposant que les donnees etaient des donnees, et non du code. Les nouvelles cons- 
tructions pourraient avoir introduit un trou de securite dans des programmes aupara- 
vant securises. Ainsi, Perl refuse d'evaluer un motif si une chaine interpolee contient 
une assertion de code et leve a la place une exception. Si vous avez vraiment besoin de 
cette fonctionnalite, vous pouvez toujours l'activer avec le pragma de portee lexicale use 
re 'eval'. (Vous ne pouvez cependant toujours pas utiliser de donnees marquees en 
tant qu'assertions de code interpole.) 

Un type completement different de soucis de securite se produisant avec les expressions 
regulieres reside dans les problemes de saturation des serveurs (denial-of-service). Ceux- 
ci peuvent faire sortir votre programme trop tot, ou tourner trop longtemps, ou encore 
epuiser toute la memoire disponible — et meme parfois faire un core dump, selon l'age 
du capitaine. 

Lorsque vous traitez des motifs fournis par l'utilisateur, vous n'avez pas a vous inquieter 
a propos de l'interpretation de code Perl quelconque. Cependant, le moteur d'expres- 
sions regulieres possede ses propres petits compilateur et interpreteur et le motif fourni 
par l'utilisateur est capable d'inf liger un infarctus au compilateur d'expressions regulie- 
res. Si un motif interpole n'est pas valide, une exception est levee a l'execution, ce qui 
est fatal a moins de l'intercepter. Si vous essayez effectivement de l'intercepter, assurez- 
vous d'utiliser seulement eval BLOC, et non eval CHAINE, car le niveau devaluation sup- 
plemental de cette derniere forme permettrait en fait l'execution de code Perl aleatoi- 
re. A la place, faites quelque chose comme ceci : 

if (not eval { "" =~ /$corresp/; 1 }) { 

# (Maintenant faites ce que vous voulez avec un mauvais motif.) 
} else { 



Gestion du code non sur 



551 



# Nous savons que le motif est au moins securise pour la compilation, 
if ($donnee =~ /$corresp/) {...} 

} 

Un probleme plus troublant de saturation des serveurs est qu'etant donne la bonne 
donnee et le bon motif de recherche, votre programme peut sembler se bloquer a ja- 
mais. Car certaines correspondances de motifs exigent un temps de calcul exponentiel 
et cela peut facilement exceder le taux de MTBF (Mean Time Between Failures, N.d.T. : 
temps moyen de fonctionnement entre deux incidents) de notre systeme solaire. Si vous 
etes particulierement chanceux, ces motifs demandant des calcul intensifs exigeront 
egalement un espace de stockage exponentiel. Si c'est le cas, votre programme epuisera 
toute la memoire virtuelle disponible, ecroulera votre systeme, embetera vos utilisa- 
teurs et soit decedera par die avec une erreur ordinaire « Out of memory! » (depasse- 
ment de memoire), soit laissera derriere lui un fichier core dump vraiment enorme, 
peut-etre cependant pas aussi gros que le systeme solaire. 

Comme la plupart des attaques par saturation des serveurs, celle-ci n'est pas facile a re- 
soudre. Si votre plate-forme implemente la fonction alarm, vous pouvez donner un de- 
lai limite pour la correspondance de motifs. Malheureusement, Perl ne peut pas 
(actuellement) garantir que le simple acte de gerer un signal ne va jamais lever un core 
dump. (Nous avons prevu de le resoudre dans une prochaine version.) Vous pouvez ce- 
pendant toujours l'essayer et meme si le signal n'est pas gere elegamment, au moins le 
programme ne bouclera pas a jamais. 

Si votre systeme implemente des limites de ressources par processus, vous pourriez con- 
figurer celles-ci dans votre shell avant d'appeler le programme Perl ou utiliser le module 
BSD: :Ressource de CPAN pour le faire directement en Perl. Le serveur web Apache 
vous permet de fixer des limites de temps, de memoire et de taille de fichiers sur les 
scripts CGI qu'il lance. 

Finalement, nous esperons que nous vous avons laisse un sentiment non resolu d'inse- 
curite. Souvenez-vous que si vous etes paranoiaque, cela ne veut pas dire pour autant 
qu'il n'y a personne a vos trousses. Alors vous feriez mieux de vous en accommoder. 
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Adressez-vous a n'importe quel programmeur Perl et il sera heureux de vous donner des 
pages et des pages de conseil sur la maniere de programmer. Nous ne sommes pas diffe- 
rents (au cas oil vous ne l'ayez pas remarque). Dans ce chapitre, plutot que d'essayer de 
vous exposer les caracteristiques specifiques de Perl, nous prendrons la direction oppo- 
see en distillant quelques descriptions des techniques idiomatiques en Perl. Nous espe- 
rons qu'en rassemblant divers petits morceaux qui semblent sans rapport les uns avec 
les autres, vous parviendrez a vous imbiber du sentiment de ce qu'est vraiment « penser 
en Perl ». Apres tout, lorsque vous programmez, vous n'ecrivez pas un paquet d'expres- 
sions, puis un paquet de sous-programmes, puis un paquet d'objets. Vous devez tout ap- 
prehender d'un seul coup, plus ou moins. Voila done a quoi ressemble ce chapitre. 

II y a tout de meme une organisation rudimentaire dans ce chapitre, en ce que nous 
commencerons par les conseils negatifs et tracerons le chemin jusqu'au conseils positifs. 
Nous ne savons pas si vous vous sentirez mieux grace a cela mais cela nous aidera, nous, 
a nous sentir mieux. 

Etourderies courantes des debutants 

La plus grande etourderie est d'oublier d'utiliser use warnings, qui releve de nombreu- 
ses erreurs. La deuxieme est de ne pas utiliser use strict quand il le faut. Ces deux prag- 
mas peuvent vous economiser des heures de casse-tete lorsque votre programme 
commence a grossir. (Et ce sera le cas.) Un autre faux pas consiste a oublier de consulter 
la FAQ en ligne. Imaginez que vous vouliez trouver si Perl dispose d'une fonction round. 
Vous devriez essayer de chercher d'abord dans la FAQ : 

% perlfaq round 

A part ces « meta-etourderies », il y a plusieurs types de pieges de programmation. Cer- 
tains pieges dans lesquels presque tout le monde tombe et d'autres dans lesquels vous 
ne tombez que si vous etes originaire d'une culture particuliere possedant des pratiques 
differentes. Nous les avons repartis dans les sections suivantes. 
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Erreurs universelles 

Mettre une virgule apres le handle de fichier dans une instruction print. Bien qu'il 
paraisse tout a fait rationnel et elegant d'ecrire : 

print STDOUT, "adieu, monde ", $adj, " !\n"; # MAUVAIS 
c'est neanmoins incorrect, a cause de la premiere virgule. Ce qu'il faut a la place est 
la syntaxe d'objet indirect : 

print STDOUT "adieu, monde ", $adj, " !\n"; # ok 
La syntaxe est ainsi faite que Ton puisse ecrire : 

print $handle_fichier "adieu, monde ", $adj, " !\n"; 
oil $handle_f ichier est un scalaire contenant le nom d'un handle de fichier a l'exe- 
cution. Ce qui est different de : 

print $pas_un_handle_fichier, "adieu, monde ", $adj, " !\n"; 
ou $pas_un_handle_f ichier n'est qu'une chaine qui est ajoutee a la liste de ce qui 
doit etre imprime. Voir « objet indirect » dans le glossaire. 

• Utiliser == au lieu de eq et != au lieu de ne. Les operateurs == et != sont des tests 
numeriques. Les deux autres sont des tests sur les chaines. Les chames "123" et 
"123 .00" sont egales en tant que nombres, mais pas en tant que chaines. De meme, 
les chames non-numeriques sont numeriquement egales a zero. A moins que vous 
ne traitiez des nombres, vous utilisez presque toujours a la place les operateurs de 
comparaison de chames. 

• Oublier le point-virgule final. Chaque instruction Perl est terminee par un point- 
virgule ou la fin d'un bloc. Les sauts de ligne ne sont pas des terminateurs destruc- 
tion comme en awk, en Python ou en FORTRAN. Souvenez-vous que Perl est 
comme C. 

Une instruction contenant un document « ici-meme » (here document) est tout par- 
ticulierement apte a perdre son point-virgule. Cela devrait ressembler a ceci : 
print «'FINIS J ; 

Sans une grande roideur et une continuelle 
attention a toutes ses paroles, on est expose a 
dire en moins d'une heure le oui et le non sur une 
meme chose ou sur une meme personne, determine 
seulement par un esprit de societe et de commerce 
qui entraine naturellement a ne pas contredire 
celui-ci et celui-la qui en parlen differemment. 

-- Dean de La Bruyere 

FINIS 

• Oublier qu'un BLOC exige des accolades. Les instructions seules ne forment pas de 
BLOC par elles-memes. Si vous creez une structure de controle comme un while ou 
un if qui demande un ou plusieurs BLOC s, vous devez utiliser des accolades autour 
de chaque BLOC. Souvenez-vous que Perl n'est comme C. 

• Ne pas sauver $1, $2, etc., dans les expressions regulieres. Souvenez-vous que cha- 
que nouvelle correspondance (m//) ou substitution (s///) modifie (ou remet a zero 
ou ecrase) vos variables $1, $2. . . , ainsi que $', $&, $' et consorts. Une maniere de 
les sauvegarder consiste a evaluer la correspondance dans un contexte de liste, 
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comme dans : 

my ($un, $deux) = /(\w+) (\w+)/; 

• Ne pas se rendre compte qu'un local change aussi la valeur de la variable telle que 
la voient les autres sous-programmes appeles depuis l'interieur de la portee du 
local. II est facile d'oublier que local est une instruction d'execution qui travaille 
dans une portee dynamique, car il n'en existe aucun equivalent dans des langages 
comme C. Voir la section Declarations avec portee au chapitre 4, Instructions et decla- 
rations. De toute facon, il est en general preferable d'utiliser un my. 

• Perdre la trace des appariements d'accolades. Un bon editeur vous aidera a trouver 
les paires correspondantes. Prenez-en un. (Ou deux.) 

• Employer des instructions de controle de boucle dans un do {} while. Bien que les 
accolades dans cette structure de controle ont fair de faire partie d'un BLOC de bou- 
cle, ce n'est en fait pas le cas. 

• Utiliser $truc[l] alors que vous voulez dire $truc[o]. Les tableaux commence par 
defaut a zero en Perl. 

• Ecrire @truc[o] alors que vous vouliez dire $truc[o]. La reference a @truc[o] est 
une tranche de tableau, representant un tableau constitue du seul element 
$truc[o]. Parfois, cela ne fait aucune difference, comme dans : 

print "la reponse est @truc[o]\n"; 
Mais la difference est enorme pour des choses comme : 
@truc[u] = <STDIN>; 

qui va absorber tout STDIN en affectant la premiere ligne a $truc[o] et en rejetant 
tout le reste, ce qui n'est probablement pas ce que vous aviez prevu. Prenez l'habi- 
tude de considerer que $ represente une valeur unique, alors que @ represente une 
liste de valeurs, et tout ira bien. 

• Oublier les parentheses avec un operateur de liste comme my : 

my $x, $y = (4, 8); # FAUX my ($x, $y) = (4, 8); # ok 

• Oublier de selectionner le bon handle de fichier avant de positionner $ A , $~ ou $ | . 
Ces variables dependent du handle de fichier actuellement selectionne, comme le 
determine select (HANDLE_FICHIER). Le handle de fichier initialement selec- 
tionne est STDOUT. Vous devriez vraiment plutot utiliser les methodes de handles de 
fichiers du module FileHandle. Voir le chapitre 28, Noms speciaux. 

Conseilsfrequemment ignores 

Les programmeurs Perl Pratiquants devraient prendre note de ce qui suit : 

• Souvenez-vous que de nombreuses operations se comportent differemment dans 
un contexte de liste et dans un contexte scalaire. Par exemple : 



($x) = 


■ (4, 5, 


6); 


# Contexte de liste ; 


$x vaut 4 


$x = 


(4, 5, 


6); 


# Co e scalaire ; 


$x vaut 6 


@a = 


(4, 5, 


6); 






$x = 


@a; 




# Contexte scalaire ; 


$x vaut 3 



# (la longueur du tableau) 
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' Evitez si possible les mots simples, surtout s'ils sont entierement en minuscules. II 
est impossible de savoir du premier coup d'ceil si un mot est une fonction ou une 
chame brute. Vous supprimerez toute confusion en protegeant les chaines par des 
guillemets et des parentheses autour des arguments d'appels de fonction. En fait, le 
pragma use strict au debut de votre programme donne une erreur de compila- 
tion si Ton utilise un mot simple — ce qui est probablement une bonne chose. 

• On ne peut pas distinguer au premier coup d'oeil les fonctions internes qui sont des 
operateurs unaires (comme chop et chdir), celles qui sont des operateurs de liste 
(comme print et unlink) et celles qui n'ont pas d'argument (comme time). II vous 
faut les apprendre au chapitre 29. Comme toujours, utilisez des parentheses si vous 
n'etes pas stirs — et mime si vous n'etes pas stirs d'etre stirs. Remarquez egalement 
que les sous-programmes definis par l'utilisateur sont par defaut des operateurs de 
liste mais peuvent etre declares comme operateurs unaires avec un prototype 
valant ($) ou sans arguments avec un prototype valant (). 

• On a souvent du mal a se souvenir que certaines fonctions emploient par defaut $_, 
ou @ARGV ou autre chose, alors que d'autres non. Prenez le temps d'apprendre les- 
quelles, ou evitez les arguments par defaut. 

• <HF> n'est pas le nom d'un handle de fichier mais un operateur d'angle qui effectue 
une operation d'entree par ligne sur le handle. Cette confusion se manifeste genera- 
lement quand des gens essayent un print sur l'operateur angle : 

print <HF> "salut"; # MAUVAIS, omettre les angles 

• Souvenez-vous egalement que les donnees lues par l'operateur d'angle ne sont 
affectees a $_ que lorsque le fichier lu est la seule condition d'une boucle while : 

while (<HF>) { } # Donnees affectees a $_. 
<HF>; # donnees lues et eliminees ! 

• N'utilisez pas = lorsque vous avez besoin de =~ ; les deux constructions sont tres dif- 
ferentes : 

$x = /true/; # recherche "true" dans $_, met le resultat dans $x 

$x =~ /true/; # recherche "true" dans $x, elimine le resultat 

• Utilisez my pour les variables locales chaque fois que vous pouvez vous en accom- 
moder. local donne en fait une valeur temporaire a une variable globale, ce qui 
vous expose grandement aux effets secondaires dus a la portee dynamique 

• N'utilisez pas local sur les variables exportees par un module. La localisation 
d'une variable exportee ne fait pas changer sa valeur. Le nom local devient l'alias 
d'une nouvelle valeur mais le nom externe reste l'alias de l'original. 

Pieges du C 

Les programmeurs Cerebraux du C devraient prendre note de ce qui suit : 

• Les accolades sont obligatoires pour les blocs if et while. 

• Vous devez utiliser elsif plutot que « else if » ou de « elif ». Une syntaxe 
comme : 

if (expression) { 
bloc; 
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} 

else if (autreexpression) { # MAUVAIS 
autre_bloc; 

} 

est illegale. La partie else est toujours un bloc et un if tout nu n'est pas un bloc. 
Ne vous attendez pas a ce que Perl se comporte exactement comme le C. A la place, 
il faut ecrire : 

if (expression) { 
bloc; 

} 

elsif (autre_expression) { 
autre_bloc; 

} 

Remarquez egalement que « elif » est « file » ecrit a l'envers. Seuls des fanati- 
ques d'Algol pourraient tolerer un mot-clef identique a un autre mot ecrit a 
l'envers. 

• Les mots-clefs break et continue de C deviennent respectivement last et next en 
Perl. En revanche, ces derniers ne fonctionnent pas dans une construction do {} 
while. 

• II n'existe pas d'instruction switch. (Mais il est facile d'en elaborer une au vol ; voir 
les paragraphes Blocs simples et Structures de cas au chapitre 4. 

• Les variables commencent par $, @ ou % en Perl. 

• Les commentaires commencent par # et non par /*. 

• Vous ne pouvez pas obtenir Fadresse de n'importe quoi, bien qu'un operateur simi- 
laire en Perl soit l'antislash, qui cree une reference. 

• ARCV doit etre en majuscules. $ARGV[o] est le argv[l] de C et le argv[o] de C 
devient $0. 

• Les appels systeme comme link, unlink et rename renvoient vrai en cas de succes et 
non 0. 

• Les gestionnaires de signaux de %SIG traitent des noms de signaux et non des nom- 
bres. 

Pieges du shell 

Les programmeurs Sherifs du Shell devraient prendre note de ce qui suit : 

• Les variables sont prefixees par $ ou @ tant du cote gauche d'une affectation que du 
cote droit. Une affectation « a la shell » comme : 

chameau^dromadaire' ; # MAUVAIS 
ne sera pas analysee comme prevu. Vous devez mettre : 
$chameau=-'dromadaire'' ; # ok 

• La variable de boucle pour un foreach exige egalement un $. Meme si csh prefere : 

foreach bosse (une deux) 
remplir $bosse 

end 
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en Perl, ceci s'ecrit plutot : 

foreach $bosse ("une", "deux") { 
remplir($bosse); 

} 

• L'operateur apostrophe inverse interpole les variables sans se preoccuper de la pre- 
sence d'apostrophes dans la commande. 

• L'operateur apostrophe inverse ne convertit pas la valeur de retour. En Perl, il faut 
explicitement eliminer le saut de ligne, comme ceci : 

chop($mon_hote = 'hostname'); 

• Les shells (surtout csh) offrent plusieurs niveaux de substitution sur la ligne de 
commande. Perl n'effectue de substitution que dans certaines constructions comme 
les guillemets, les apostrophes inverses, les signes inferieurs et superieurs et les 
motifs de correspondance. 

• Les shells ont tendance a interpreter les scripts petit a petit. Perl compile le pro- 
gramme entier avant de l'executer (hormis les blocs BEGIN, qui s'executent avant 
que la compilation soit achevee). 

• Les arguments sont accessibles via (SARGV et non $1, $2, etc. 

• L'environnement n'est pas automatiquement accessible sous forme de variables sca- 
laires separees. Utilisez le module standard Env si vous voulez que ce soit le cas. 

Pieges des anciens Perl 

Les programmeurs Penitents de Perl 4 (et des Precedents) devraient prendre note des 
modifications suivantes entre la version 4 et la version 5 qui pourraient affecter les an- 
ciens scripts : 

• @ interpole maintenant systematiquement un tableau dans des chaines protegees 
par guillemets. Certains programmes doivent maintenant utiliser l'antislash pour 
proteger les @ qui ne devraient pas etre interpolees. 

Les mots simples qui ressemblaient a des chaines a Perl ont maintenant l'air 
d'appels a un sous-programme si un sous-programme de ce nom est defini avant 
que le compilateur ne les voie. Par exemple : 

sub Ciao { die "Hasta la vista, baby !" } 

$SIG{ J QUIT'} = Ciao; 
Dans les precedentes versions de Perl, ce code mettait en place le gestionnaire de 
signal. II appelle maintenant la fonction ! Vous pouvez utiliser l'option -w pour 
detecter cette construction a risque ou use strict pour la rendre illegale. 

• Les identificateurs commencant par « _ » ne se trouvent plus forcement dans le 
paquetage main, sauf le symbole souligne brut lui-meme (comme dans $_, @_, etc). 

• Le double deux-points est maintenant un separateur de paquetage valide dans un 
identificateur. Ainsi, l'instruction : 

print "$a::$b::$c\n" 
analyse maintenant $a : : comme la reference a la variable, alors que dans les ver- 
sions precedentes, seul le $a etait considere comme la reference a la variable. De 
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meme : 

print "$var: :abc: :xyz\n"; 
est maintenant interprete comme une variable unique $var: :abc: :xyz, alors que 
dans les versions precedentes, la variable $var aurait ete suivie par le texte constant 
: :abc: :xyz. 

s'$motif 'remplacement' n'interpole plus $motif. (Le $ serait interprete comme 
une assertion de fin de ligne.) Ce comportement n'arrive que dans Futilisation 
d'apostrophes en tant que separateur de substitution ; dans les autres substitutions, 
$motif est toujours interpole. 

• Le deuxieme et le troisieme argument de splice sont maintenant evalues dans un 
contexte scalaire plutot que dans contexte de liste. 

Des erreurs semantiques apparaissent maintenant en raison de la precedence : 

shift @liste + 20; # maintenant analyse comme shift((5>liste + 20), 

# illegal ! 

$n = keys %map + 20; # maintenant analyse comme keys(%map + 20), 

# illegal ! 

Parce que si ces derniers fonctionnaient, ceci ne le pourrait pas : 
sleep $sieste + 20; 

• La precedence des operateurs d'affectation est maintenant la meme que celle de 
1'afFectation. Les versions anterieures de Perl leur donnaient par erreur la prece- 
dence de l'operateur associe. II faut done maintenant les encadrer entre parentheses 
dans des expressions comme : 

/true/ ? ($a += 2) : ($a -= 2); 
Sinon 

/true/ ? $a += 2 : $a -= 2; 
serait analyse par erreur en : 

(/true/ ? $a += 2 : $a) -= 2; 
En revanche, 

$a += /true/ ? 1 : 2; 
fonctionne maintenant comme s'y attendrait un programmeur C. 

• open TRUC | | die est maintenant incorrect. II faut des parentheses autour du han- 
dle de fichier, car open a la precedence d'un operateur de liste. 

• Les elements des listes d'arguments pour les formats sont maintenant evalues dans 
un contexte de liste. Cela signifie que vous pouvez maintenant interpoler des 
valeurs de liste. 

• Vous ne pouvez pas aller par un goto dans un bloc que Foptimisation a supprime. 
Damnation. 

II n'est plus legal d'employer un espace comme nom de variable ou comme delimi- 
teur de construction protegee. Enfer et damnation. 

• La fonction caller renvoie maintenant une valeur fausse dans un contexte scalaire 
s'il n'y a pas d'appelant. Cela permet aux modules de determiner s'ils sont requis ou 
lances directement. 
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' m//g rattache maintenant son etat a la chaine recherchee plutot qu'a l'expression 
reguliere. Voir le chapitre 5, Correspondance de motifs pour plus de details. 

• reverse n'est plus autorise en tant que nom de routine pour de tri pour sort. 

• taintperl n'est plus un executable separe. II existe maintenant une option -T qui 
active le marquage quand il ne Test pas automatiquement. 

• Les chaines entre guillemets ne peuvent plus se terminer par un $ ou un @ non pro- 
tege. 

• La syntaxe archai'que if BLOC BLOC n'est plus supportee. 

• Les indices de tableau negatifs comptent maintenant depuis la fin du tableau. 

• II est maintenant garanti que l'operateur virgule, dans un contexte scalaire, procure 
un contexte scalaire a ses arguments. 

• L'operateur ** lie maintenant plus etroitement que le moins unaire. 

• Diminuer $#tableau elimine maintenant immediatement des elements du 
tableau. 

II n'est pas garanti que delete renvoie la valeur detruite des tableaux lies par tie 
car l'implementation de cette fonctionnalite serait onereuse pour certains modules. 

• La construction "ceci est $$x", qui interpolait FID du processus a cet endroit, 
essaie maintenant de dereferencer $x. Toutefois, $$ tout seul, fonctionne toujours 
tres bien. 

• Le comportement de foreach a legerement change lorsqu'il parcours iterativement 
dans une liste qui n'est pas un tableau. II affectait la liste a un tableau temporaire 
mais ne le fait plus pour des raisons d'efficacite. Cela signifie que Fon parcourt 
maintenant les valeurs actuelles et non les copies des valeurs. Les modifications de 
la variable de boucle peuvent changer les valeurs originelles, meme apres un grep ! 
Par exemple 

% perl4 -e '@a = (1,2,3); for (grep(/./, @a)) { $_++ }; print "(SaW 
12 3 

% perls -e '@a = (1,2,3); for (grep(/./, @a)) { $_++ }; print "@a\n"' 

2 3 4 

Pour conserver Fancien comportement de Perl, vous devrez affecter explicitement 
la liste a un tableau temporaire et ensuite parcourir ce dernier. Par exemple, vous 
pourriez avoir besoin de changer : 

foreach $var (grep lul, @liste) { ... } 

en 

foreach $var (my @tmp = grep Ixl , @list) { ... } 
Autrement, la modification de $var ecrasera aussi les valeurs de @liste. (Cela se 
produit le plus souvent lorsque vous utilisez $_ comme variable de boucle et que 
vous appelez des sous-programmes dans la boucle qui ne mettent pas correctement 
$_ en local). 

• Certains messages d'erreur sont differents. 

• Certains bogues ont ete elimines par inadvertance. 
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Efficacite 

Alors que Fessentiel du travail de programmation peut se resumer a un fonctionnement 
correct, vous pouvez vous retrouver a vouloir parfois un meilleur rapport qualite/prix 
pour votre programme Perl. Le vaste ensemble d'operateurs, les types de donnees et les 
structures de controle de Perl ne sont pas forcement intuitifs quant a la rapidite d'exe- 
cution et a l'optimisation de l'espace memoire. De nombreux compromis ont ete neces- 
saires pendant la conception de Perl et ces decisions sont profondement ancrees dans les 
entrailles du code. En general, plus un programme est court et simple, plus il est rapide 
mais il existe des exceptions. Ce paragraphe tente de vous aider a le faire fonctionner jus- 
te un petit peu mieux. 

Si vous voulez qu'il tourne beaucoup mieux, vous pouvez jouer avec la sortie (backend) 
du compilateur de Perl, decrite au chapitre 18, Compiler ou reecrire votre boucle interne 
dans une extension C, comme l'illustre le chapitre 21, Me'canismes internes et externes. 

Vous remarquerez que l'optimisation de la vitesse d'execution est parfois couteuse en 
termes d'espace memoire ou d'efficacite pour le programmeur (on s'en rend compte en 
constatant que certaines des astuces ci-dessous sont incompatibles entre elles). Voila le 
hie. Si la programmation etait si simple, il n'y aurait pas besoin de quelque chose d'aussi 
complique qu'un etre humain pour s'en occuper, n'est-ce pas? 

Efficacite du temps d'execution 

• Utilisez des hachages au lieu de recherches lineaires. Par exemple, au lieu de cher- 
cher dans @mots_cles pour voir si $_ est un mot-cle, construisez un hachage avec : 

my %mots_cles; 
for ((8mots_cles) { 
$mots_cles{$_}++; 

} 

Vous pouvez alors savoir si $_ contient un mot-cle en testant si $mots_cles{$_} 
donne une valeur non nulle. 

• Evitez d'indicer alors qu'un foreach ou un operateur de liste fait Faffaire. Non seu- 
lement l'indkage est une operation supplementaire, mais si votre variable d'indi- 
cage se trouve etre un nombre a virgule flottante apres avaoir fait de 
Farithmetique, une conversion supplementaire vers un entier est necessaire. II y a 
souvent mieux a faire. Essayez d'utiliser les operations foreach, shift et splice. 
Pensez a ecrire use integer. 

• Evitez goto. II va chercher l'etiquette correspondante hors de Fendroit oil vous 
vous trouvez. 

• Evitez printf lorsque print fait l'affaire. 

• Evitez $& et ses deux copains, $' et $\ La moindre occurrence dans votre pro- 
gramme fait que toutes les correspondances sauvegardent la chaine recherchee 
pour une reference ulterieure possible (cela dit, une fois que e'est fait, vous pouvez 
en mettre autant que vous voulez). 

• Evitez d'utiliser eval sur une chaine. Un eval d'une chaine (mais pas d'un bloc) 
force la recompilation a chaque passage. L'analyseur syntaxique de Perl est plutot 
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rapide pour un analyseur, ce qui ne veut pas dire grand-chose. De nos jours, il existe 
presque toujours un meilleur moyen d'arriver a vos fins. En particulier, tout code 
utilisant eval pour construire des noms de variable est obsolete, puisque vous arri- 
vez maintenant a la meme chose en utilisant directement des references symboli- 
ques : 

no strict 'refs'; 
$nom = "variable"; 

$$nom = 7; # Positionne $variable a 7 

• Evitez eval CHAINE a Pinterieur d'une boucle. Mettez plutot la boucle dans Peval, 
pour eviter des compilations redondantes du code. Voir l'operateur study au chapi- 
tre 29 pour en trouver un exemple. 

• Evitez les motifs compiles a Pexecution. Utilisez le modificateur de motif I motif I o 
(une seule fois) pour eviter les recompilations du motif quand celui-ci ne change 
pas durant la vie du processus. Pour les motifs qui changent occasionnellement, 
vous pouvez utiliser le fait qu'un motif nul se refere au motif precedent, comme 
ceci : 

"chaine_trouvee" =~ /$motif_courant/; # Correspondance bidon 

# (doit reussir). 

while (<>) { 
print if //; 

} 

Ou alors, vous pouvez precompiler votre expression reguliere en utilisant la cons- 
truction de protection qr. Vous pouvez egalement utiliser eval pour recompiler un 
sous-programme realisant la recherche de correspondance (si vous ne recompilez 
qu'occasionnellement). Cela fonction encore mieux si vous compilez une f lopee de 
recherches de correspondances dans un seul sous-programme, en amortissant ainsi 
la surcharge due a Pappel de sous-programme. 

• Un court-circuit entre deux choix possibles est souvent plus rapide que Pexpression 
reguliere correspondante. Ainsi : 

print if /une-bosse/ | | /deux/; 
est susceptible d'etre plus rapide que 

print if /une-bosse | deux/; 
du moins pour certaines valeurs de une-bosse et de deux. En effet, Poptimiseur 
aime loger certaines operations simples de recherche de correspondance dans des 
parties hautes de Parbre syntaxique et effectue une recherche de correspondance 
tres rapide grace a un algorithme de Boyer-Moore. Un motif complique en fait per- 
dre le benefice. 

• Rejetez les cas frequents le plus tot possible avec next if. Tout comme pour les 
expressions regulieres simples, Poptimiseur prefere cela. Et cela a toujours un sens 
d'eviter le travail superf lu. Vous pouvez typiquement eliminer les lignes de com- 
mentaire et les lignes vides avant meme de faire un split ou un chop : 

while (<>) { 

next if / A #/; 
next if / A $/; 
chop; 
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@gorets = split(/,/); 

} 

• Evitez les expressions regulieres comportant de nombreux quantificateurs ou de 
grands nombres {MIN,MAX} pour des expressions entre parentheses. De tels motifs 
peuvent engendrer un comportement de retour arriere d'une lenteur exponen- 
tielle a moins que les sous-motifs quantifies ne correspondent a la premiere 
« passe ». Vous pouvez egalement utiliser la construction (?>...) pour forcer un 
sous-motif a correspondre completement ou a echouer sans retour arriere. 

• Essayez de maximiser la longueur de toute chaine non optionnelle dans les expres- 
sions regulieres. Ce principe n'est pas intuitif mais les longs motifs trouvent sou- 
vent plus vite une correspondance que les courts. En effet, l'optimiseur recherche 
les chaines constantes et les passe a une recherche de Boyer-Moore, qui fonctionne 
mieux avec de longues chaines. Compilez votre motif avec l'option de debogage -Dr 
pour voir ce que Dr. Perl pense etre la chaine constante la plus longue. 

• Evitez les appels de sous-programmes couteux dans les boucles courtes. L'appel de 
sous-programmes engendre une certaine surcharge, surtout quand vous leur passez 
de longues listes de parametres ou que les valeurs renvoyees sont longues. Essayez, 
par ordre croissant de desespoir, de passer les valeurs par reference, de passer les 
valeurs en tant que variables globales de portee dynamique, d'inserer le sous-pro- 
gramme litteralement (Mining) ou de reecrire toute la boucle en C. (Si vous pouvez 
mettre le sous-programme hors d'etat de nuire en utilisant un algorithme plus 
malin, c'est encore mieux que toutes ces solutions.) 

• N'employez getc que pour les entrees/sorties caractere par caractere sur le termi- 
nal. En fait, ne l'utilisez pas du tout. Employez sysread. 

• Evitez les substr frequents sur les longues chaines, surtout si la chaine contient de 
FUTF-8. II n'y a pas de probleme pour utiliser substr au debut d'une chaine et, 
pour certaines taches, vous pouvez garder le substr au debut : utilisez la forme a 
quatre arguments de substr et « croquez » la chaine en remplacant la partie que 
vous avez happee par " " : 

while ($tampon) { 

traiter(substr($tamponj 0, 10, "")); 

} 

• Utilisez pack et unpack au lieu de plusieurs substr. 

• Utilisez substr en tant que lvalue au lieu de concatener des sous-chaines. Par exem- 
ple, pour remplacer les caracteres allant du quatrieme au septieme de $truc avec le 
contenu de la variable $machin, ne faites pas : 

$truc = substr($truc,0,3) . $machin . substr($truc,7); 
Contentez-vous a la place d'identifier la partie de la chaine a remplacer et affectez-y 
une valeur, comme dans : 

substr($truc, 3, 4) = $machin; 
Mais faites attention que si $truc est une chaine enorme et que $machin n'est pas 
exactement de meme longueur que le « trou », cela entraine egalement beaucoup 
de copies. Perl essaie de minimiser cela en copiant soit le debut, soit la fin mais il y 
a trop de travail a accomplir si le substr est au milieu. 
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• Utilisez si 1 1 au lieu d'une concatenation de sous-chaihes. Surtout si vous pouvez 
remplacer une constante par une autre de la meme taille. La substitution se fait 
alors sur place. 

• Utilisez les modificateurs et les operateurs equivalents and et or, au lieu des cons- 
tructions conditionnelles completes. Les modificateurs d'instructions (comme 
$alliance = 0 unless $f iance) et les operateurs logiques evitent la surcharge due 
a Fentree et a la sortie d'un bloc. De plus, ils sont souvent plus lisibles. 

• Utilisez $truc = $a | | $b | | $c. C'est beaucoup plus rapide (et plus court) que : 

if ($a) { 

$truc = $aj 

} 

elsif ($b) { 
$truc = $b; 

} 

elsif ($c) { 
$truc = $c; 

} 

De meme, mettez les valeurs par defaut avec : 
$pi 1 1= 3; 

• Regroupez tous les tests qui demandent la meme chaine initiale. Au moment de 
tester une chame pour y chercher divers prefixes ressemblant un tant soit peu a un 
branchement conditionnel multiple {NAT. : switch structure), rassemblez tous les 
motifs / A a/, tous les / A b/, et ainsi de suite. 

• Ne testez pas de choses pour lesquelles vous savez qu'on ne peut pas trouver de cor- 
respondance. Utilisez last ou elsif pour eviter que la recherche de correspon- 
dance echoue pour le cas suivant dans votre instruction switch. 

• Utilisez des operateurs speciaux comme study, les operations logiques sur les chai- 
nes, les formats pack 'u' et unpack '%' . 

• Attention a ne pas utiliser un marteau-pilon pour ecraser une mouche. Des instruc- 
tions mal concues comme (<STDIN>)[0] peuvent exiger de Perl un travail inutile. 
C'est en plein accord avec la philosophic UNIX que Perl vous donne la corde pour 
vous pendre. 

• Factorisez les operations hors des boucles. L'optimiseur de Perl n'essaie pas d'enle- 
ver le code invariant des boucles. II vous demande un certain bon sens. 

• Les chaines peuvent etre plus rapides que les tableaux. 

• Les tableaux peuvent etre plus rapides que les chaines. Tout depend de la reutilisa- 
tion ulterieure des chaines ou des tableaux et de quelles operations il s'agit. Des 
modifications importantes de chaque element conviennent mieux aux tableaux, 
alors qu'une modification occasionnelle de quelques elements convient mieux aux 
chaines. Mais le plus souvent, vous devez essayer et aviser. 

• Les variables my sont plus rapides que les variables local. 

• Le tri selon une cle de tableau fabriquee peut etre plus rapide qu'un joli sous-pro- 
gramme de tri. Une valeur de tableau donnee sera generalement comparee plu- 
sieurs fois; done si le sous-programme doit effectuer de nombreux recalculs, il vaut 
mieux factoriser ce calcul dans une passe separee avant le tri reel. 
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• Si vous supprimez des caracteres, tr/abc//d est plus rapide que s/[abc]//g. 

• print avec une virgule comme separateur peut etre plus rapide que la concatena- 
tion de chaines. Par exemple : 

print $nom_complet{$nom} . " a un nouveau repertoire home " . 
$home{$nom} . "\n"; 

doit coller ensemble les deux hachages et les deux chaines constantes avant de les 
passer aux routines de bas niveau, ce qui n'est pas le cas de : 

print $nom_complet{$nom}, " a un nouveau repertoire home ", 
$home{$nom}, "\n"; 

Cela dit, et selon les valeurs et l'architecture, la concatenation peut etre plus rapide. 
Essayez. 

• Preferez join("", ...) a une serie de chaines concatenees. Des concatenations 
multiples peuvent effectuer des copies de chaines incessantes, ce qu'evite l'opera- 
teur join. 

split sur une chaine constante est plus rapide que split sur un motif. C'est-a-dire 
qu'il vaut mieux utiliser split(/ I , . . . ) plutot que split(/ +/, . . . ) si vous 
savez qu'il n'y aura qu'un espace. Cependant, les motifs As+/, / A / et / / sont parti- 
culierement optimises, de meme que le split special sur du blanc. 

II peut etre rentable de pre-etendre un tableau ou une chaine. Au fur et a mesure 
de l'accroissement des chaines et des tableaux, Perl les etend en allouant une nou- 
velle copie avec de Fespace pour la croissance et en y copiant l'ancienne valeur. La 
pre-extension d'une chaine avec l'operateur x ou d'un tableau en positionnant 
$#tableau peut prevenir cette surcharge occasionnelle, ainsi que minimiser la frag- 
mentation memoire. 

Ne undef inissez pas de longues chaines et de longs tableaux s'ils doivent etre reuti- 
lises dans le meme but. Ceci afin de ne pas devoir reallouer quand la chaine ou le 
tableau devra etre re-etendu. 

• Preferez "\0" x 8192 a unpack("x8l92", ()). 

• system("mkdir . . . ") peut etre plus rapide sur plusieurs repertoires si l'appel sys- 
teme mkdir(2) n'est pas disponible. 

• Evitez d'employer eof ( ) si les valeurs de retour l'indiquent deja. 

• Mettez dans un cache les entrees des fichiers (comme les fichiers passwd et group) 
qui sont susceptibles d'etre reutilisees. II est particulierement important de mettre 
dans un cache les entrees provenant du reseau. Par exemple, pour mettre dans un 
cache la valeur de retour de gethostbyaddr lorsque vous convertissez des adresses 
numeriques (comme 204.148.40.9) en noms (comme « www.ora.com »), vous pou- 
vez utiliser quelque chose comme : 

sub numennom { 

local($_) = @_j 

unless (defined $num_en_nom{$_}) { 

my(@a) = gethostbyaddr(pack('C4', split(/\./)), 2); 
$num_en_nom{$_} = @a > 0 ? $a[o] : $_; 

} 

return $num_en_nom{$_}; 

} 
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' Evitez les appels systeme inutiles. Les appels au systeme d'exploitation sont souvent 
couteux. Ainsi, par exemple, n'appelez pas l'operateur time lorsqu'une valeur, 
$maintenant, en cache fait l'affaire. Utilisez le handle de fichier special _ pour evi- 
ter des appels inutiles a stat(2). Sur certains systemes, meme un appel systeme mini- 
mal peut executer un millier d'instructions. 

• Evitez les appels inutiles a system. L'operateur system doit creer un sous-processus 
et executer le programme specifie — ou pis encore, executer un shell pour executer 
le programme specifie. On en arrive facilement a un million d'instructions. 

• Inquietez-vous de lancer des sous-processus, mais seulement s'ils sont frequents. Le 
lancement d'un simple processus pwd, hostname ou find ne vous fera pas beaucoup 
de mal — apres tout, un shell n'arrete pas de lancer des sous-processus toute la jour- 
nee. II nous arrive d'encourager l'approche boite a outils. Mais si, mais si. 

• Gardez la trace de votre repertoire de travail courant au lieu d'appeler sans arret 
pwd. (Un module est fourni dans la bibliotheque standard a cet effet. Voyez le 
module Cwd au chapitre 30, Bibliotheque standard.) 

• Evitez les metacaracteres du shell dans les commandes — passez au besoin des listes 
a system et a exec. 

Mettez le sticky bit sur l'interpreteur Perl sur les machines ne disposant pas de pagi- 
nation a la demande : 

chmod +t /usr/bin/perl 

• Pour mettre dans un cache les resultats de fonction, utilisez le module Memoize de 
CPAN. 

Efficacitede Vespace memoire 

• Vous pouvez utilisez vec pour un stockage compact des tableaux d'entiers si les 
entiers sont de taille fixe. (Les entiers de taille variable peuvent etre stockes dans 
des chaines UTF8.) 

• Preferez les valeurs numeriques aux valeurs de chaines equivalentes — elles 
demandent moins de memoire. 

• Employez substr pour stacker des chaines de longueur constante dans une chaine 
plus grande. 

• Employez le module Tie: :SubstrHash pour un stockage tres compact d'un 
hachage, si les longueurs de clef et de valeur sont fixees. 

• Utilisez END et le handle de fichier DATA pour eviter de stocker des donnees de 

programme a la fois comme chaine et comme tableau. 

• Preferez each a keys lorsque l'ordre n'a pas d'importance. 

Supprimez ou undef inissez les variables globales qui ne sont plus utilisees. 

• Utilisez un type de DBM pour stocker les hachages. 

• Utilisez des fichiers temporaires pour stocker les tableaux. 

• Utilisez des pipes pour decharger des traitements vers d'autres outils. 

• Evitez les operations de listes et les absorptions de fichiers. 
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' Evitez d'utiliser tr///. Chaque expression tr/// doit stacker une table de traduc- 
tion d'une taille non negligeable. 

• Ne deroulez pas vos boucles, n'inserez pas litteralement (inline) vos sous-program- 
mes. 

Efficacite pour le programmeur 

' Utilisez des valeurs par defaut. 

• Utilisez les raccourcis geniaux donnes par les options de ligne de commande 
comme -a, -n, -p, -s et -i. 

• Utilisez for pour signifier f oreach. 

• Lancez des commandes systeme avec des apostrophes inverses. 

• Utilisez <*>, etc. 

• Utilisez des motifs crees a l'execution. 

• Utilisez *, + et { } sans moderation dans vos motifs. 

• Traitez des tableaux complets a tour de bras et avalez des fichiers entiers a gogo. 

• Utilisez getc. 

• Utilisez $',$&et$\ 

• Ne verifiez pas les valeurs de retour sur open, puisque <HANDLE> et print HANDLE ne 
feront rien lorsqu'ils recevront un handle invalide. 

• Ne fermez pas vos fichiers avec close — ils le seront au prochain open. 

• Ne passez d'arguments aux sous-programmes. Utilisez des variables globales. 

• Ne nommez pas vos parametres de sous-programmes. Vous pouvez y acceder direc- 
tementpar $_[EXPR]. 

• Utilisez ce a quoi vous pensez en premier. 

Efficacite pour le mainteneur 

• N'utilisez pas de valeurs par defaut. 

• Utilisez f oreach pour signifier f oreach. 

• Utilisez des etiquettes de boucles significatives avec next et last. 

• Utilisez des noms de variables significatifs. 

• Utilisez des noms de sous-programmes significatifs. 

• Mettez ce qui est important en premier sur la ligne en utilisant and, or et les modi- 
ficateurs d'instruction (comme exit if $f ini). 

• Fermez vos fichiers des que vous en avez fini avec eux. 

• Utilisez des paquetages, des modules et des classes pour camoufler les details 
d'implementation. 

• Passez des arguments en tant que parametres de sous-programme. 
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• Nommez vos parametres de sous-programmes avec my. 
Mettez des parentheses dans un souci de clarte. 
Mettez de nombreux commentaires (utiles). 
Incluez de la documentation pod dans votre code. 

• Utilisez use warnings. 

• Utilisez use strict. 

Efficacite pour le porteur 

' Agitez sous son nez un genereux pourboire sous son nez. 

• Evitez les fonctions qui ne sont pas implementees partout. Vous pouvez utiliser des 
tests avec eval pour voir ce qui est disponible. 

• Utilisez le module Conf ig ou la variable $ A 0 pour trouver sur quelle machine vous 
etes en train de tourner. 

Ne vous attendez pas a ce que les flottants et les doubles existent en natif pour pack 
et unpack sur des machines exotiques. 

• Employez l'ordre des octets pour le reseau (les formats « n » et « N » de pack) pour 
envoyer des donnees binaires sur le reseau. 

• N'envoyez pas de donnees binaires sur le reseau. Envoyez de l'ASCII. Ou mieux, 
envoyez de FUTF8. Ou encore mieux, envoyez de l'argent. 

• Verifiez $] ou $ A V pour savoir si la version courante implemente toutes les fonc- 
tionnalites que vous utilisez. 

• N'employez pas $] ni $ A V Utilisez require ou use avec un numero de version. 

• Mettez une bidouille eval exec meme si vous n'en avez pas Fusage, votre pro- 
gramme pourra ainsi fonctionner sur le peu de systemes qui disposent de shells a la 
Unix mais qui ne reconnaissent pas la notation # ! . 

• Mettez la ligne #! /usr/bin/perl meme si vous ne l'utilisez pas. 

• Testez les variantes de commandes Unix. Certains programmes find ne compren- 
nent pas Foption -xdev, par exemple. 

• Evitez les variantes des commandes Unix si l'equivalent peut etre fait en interne. 
Les commandes Unix ne fonctionnent pas tres bien sous MS-DOS ou VMS. 

• Mettez tous vos scripts et toutes vos pages de manuel sur un systeme de fichiers 
reseau unique, monte sur toutes vos machines. 

• Publiez votre module sur CPAN. Vous recevrez enormement de commentaires s'il 
n'est pas portable. 

Efficacite pour I'utilisateur 

• Au lieu d'imposer aux utilisateurs d'entrer les donnees ligne par ligne, mettez-les 
dans leur editeur favori. 

• Encore mieux, utilisez une interface graphique (GUI) comme Tk, oil ils peuvent 
controler l'ordre des evenements. (Perl/Tk est disponible sur CPAN.) 
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• Donnez aux utilisateurs quelque chose a lire pendant que vous continuez a faire 
votre travail. 

• Employez l'autochargement afin que le programme paraisse tourner plus vite. 

• Donnez la possibility d'avoir des messages d'aide a chaque invite. 

• Donnez un conseil d'utilisation utile si les utilisateurs ne donne pas d'entrees cor- 
rectes. 

• Affichez Taction par defaut a chaque invite, et peut-etre quelques autres possibili- 
tes. 

• Choisissez les valeurs par defaut pour les debutants. Permettez aux experts de les 
modifier. 

• Utilisez une entree d'un seul caractere la oil cela a un sens. 

• Modelez la dynamique d'interaction d'apres d'autres choses que l'utilisateur con- 
nait bien. 

Rendez les messages d'erreurs explicites sur ce qu'il faut corriger. Fournissez toutes 
les informations pertinentes comme le nom de fichier et le code d'erreur, comme 
ceci : 

open(FICHIER, $fichier) 

or die "$0: Ouverture de $fichier en lecture impossible : $!\n"; 

• Utilisez fork && exit pour vous detacher lorsque le reste du script fait du traite- 
ment en batch. 

• Permettez aux arguments de provenir soit de la ligne de commande, soit de l'entree 
standard. 

• Ne mettez pas de restrictions arbitraires dans votre programme. 

• Preferez les champs de longueur variable aux champs de longueur fixe. 

• Utilisez des protocoles reseau orientes texte. 

• Dites a tout le monde d'utiliser des protocoles reseau orientes texte ! 

• Dites a tout le monde de dire a tout le monde d'utiliser des protocoles reseau orien- 
tes texte ! 

Soyez paresseux par procuration. 
Soyez sympa. 

Programmation stylee 

Vous aurez certainement vos propres preferences en matiere de formatage, mais quel- 
ques lignes de conduite rendront vos programmes plus faciles a lire, a comprendre et a 
maintenir. 

Le plus important est de toujours lancer vos programmes sous le pragma use warnings. 
(Vous pouvez desactiver les avertissements dont vous ne voulez pas avec no warnings.) 
Vous devriez egalement tourner sous le pragma use strict ou avoir une bonne excuse 
pour ne pas le faire. Le pragma use sigtrap et meme use diagnostics peuvent aussi 
etre benefiques. 
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Quant a l'esthetique du code, la seule chose a laquelle Larry prete une certaine impor- 
tance est que l'accolade fermante d'un BLOC multiligne devrait se trouver sur la meme 
colonne que le mot-cle qui a commence la construction. Par ailleurs, il a d'autres prefe- 
rences qui ne sont pas si imperatives. Les exemples de ce livre respectent ces conventions 
(ou du moins le devraient) : 

• Indentation sur 4 colonnes. 

• Une accolade ouvrante doit se trouver sur la meme ligne que le mot-cle qui la pre- 
cede, si possible ; sinon, il faut les aligner verticalement. 

while ($condition) { # ici, court : sur la meme ligne 

# faire quelque chose 

} 

# si la condition deborde, aligner les accolades 

# l'une au-dessus de l'autre. 

while ($une_condition and $autre_condition 
and $encore_une_longue_condition) 

{ 

# faire quelque chose 

} 

• Mettez un espace avant l'accolade ouvrante d'un BLOC multilignes. 

• Un BLOC court peut etre mis sur une seule ligne, accolades comprises. 

• Omettez le point-virgule dans un BLOC court d'une seule ligne. 

• Entourez la plupart des operateurs avec des espaces. 

• Entourez un indice « complexe » (a l'interieur de crochets) par des espaces. 

• Mettez des lignes blanches entre les morceaux de code qui font des choses differen- 
tes. 

• Mettez un saut de ligne entre une accolade fermante et else. 

• Ne mettez pas d'espace entre un nom de fonction et sa parenthese ouvrante. 

• Ne mettez pas d'espace avant un point-virgule. 

• Mettez un espace apres chaque virgule. 

• Divisez les longues lignes apres un operateur (mais avant and et or, meme lorsqu'ils 
s'ecrivent && et | | ). 

• Alignez verticalement les items correspondants. 

• Omettez les ponctuations redondantes tant que la clarte n'en souffre pas. 

Larry a ses raisons concernant chacun de ces points mais il ne pretend pas que le cerveau 
de tout le monde fonctionne (ou ne fonctionne pas) comme le sien. 

Voici d'autres questions de style plus substantielles, qui donnent matiere a reflexion : 

• Ce n'est pas parce que vous pouvez faire quelque chose d'une certaine maniere que 
vous devez le faire ainsi. Perl est concu pour fournir plusieurs facons de faire tout ce 
que Ton veut, il convient done de choisir la plus lisible. Par exemple : 

open(TRUC,$truc) or die "ouverture de $truc impossible : $!"; 
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vaut mieux que 

die "Ouverture de $truc impossible : $!" unless open(TRUC,$truc); 
car la deuxieme maniere cache Fessentiel de l'instruction dans un modificateur. A 
Finverse, 

print "Debut de l'analyse\n" if $verbeux; 
vaut mieux que 

$verbeux and print "Debut de l'analyse\n"; 
puisque Fessentiel n'est pas de savoir si l'utilisateur a ou non tape -v. 

• De meme, ce n'est pas parce qu'un operateur vous permet d'utiliser des arguments 
par defaut que vous devez en faire usage. lis sont reserves aux programmeurs pares- 
seux qui ecrivent des scripts vite fait, ne servant qu'une fois. Si vous voulez que vos 
programmes soient lisibles, pensez a fournir les arguments. 

• Dans la meme lignee, ce n'est pas parce que vous pouvez omettre les parentheses 
dans de nombreux cas que vous devez le faire : 

return print reverse sort num values %hachage; 

return print(reverse(sort num (values(%hachage)))); 
En cas de doute, mettez des parentheses. Au pire, cela permettra aux pauvres idiots 
de taper sur la touche % dans vi. 

Meme si vous n'avez aucun doute, imaginez l'etat mental de la personne qui devra 
maintenir le code apres vous et qui mettra probablement des parentheses au mau- 
vais endroit. 

Ne vous livrez pas a un exercice stupide de contorsionniste pour sortir en haut ou 
en bas d'une boucle. Perl fournit l'operateur last qui vous permet d'en sortir au 
milieu. Vous pouvez optionnellement l'« exdenter » un peu pour le rendre plus 
visible : 

LIGNE: 

for (;;) \{ 

instructions; 
last LIGNE if $machin; 
next LIGNE if / A #/; 
instructions; 

} 

• N'ayez pas peur d'utiliser des etiquettes de boucles — elles sont la tant pour ame- 
liorer la lisibilite que pour permettre les ruptures de boucles sur plusieurs niveaux. 
Voir l'exemple precedent. 

• Evitez d'utiliser grep, map ou les apostrophes inverses dans un contexte vide, c'est-a- 
dire lorsque vous ne vous occupez pas des valeurs de retour. Ces fonctions ont tou- 
tes des valeurs de retour, qui ne demandent qu'a etre utilisees. Sinon, employez une 
boucle f oreach ou la fonction system. 

• Dans un but de portabilite, quand vous employez des fonctionnalites qui peuvent 
ne pas etre implementees sur toutes les machines, testez-les dans un eval pour 
savoir si elles echouent. Si vous connaissez la version ou le patch level (N.d.T. : 
niveau de correction) d'une fonctionnalite particuliere, vous pouvez tester $] 
($PERL_VERSION avec le module English) pour savoir si telle fonctionnalite est pre- 
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sente. Le module Conf ig permet egalement de retrouver les valeurs determinees 
par le programme Configure quand Perl a ete installe. 

• Choisissez des identificateurs mnemoniques. Si vous ne vous souvenez pas de la 
signification du terme mnemonique, il y a un probleme. 

• Alors que des identificateurs courts comme $reussi conviennent souvent parfaite- 
ment, employez des soulignes pour separer les mots. II est generalement plus facile 
de lire un $nom_de_variable_comme_ceci qu'un $NomDeVariableCommeCeci, sur- 
tout pour des lecteurs dont la langue d'origine n'est pas l'anglais. Meme chose pour 
$NOM_DE_VARIABLE_COMME_CECI. 

• Les noms des paquetages representent parfois une exception a cette regie. Perl 
reserve de facon informelle les noms en minuscule pour des modules de pragmas 
comme integer et strict. Les autres modules devraient commencer par une 
majuscule et melanger les casses, mais de preference sans caractere souligne en rai- 
son des restrictions de nommage de certains systemes de fichiers primitifs. 

• II peut s'averer utile d'utiliser les casses de caracteres pour indiquer la visibilite ou 
la nature d'une variable. Par exemple : 

$TOUT_EN_MADUSCULES # constantes uniquement (attention aux 

# conflits avec les vars de Perl!) 
$Ouelques_Majuscules # vars globales/statiques sur tout un paquetage 
$pas_de_majuscules # vars my() ou local(), dont la portee ne 
#depasse pas une fonction 
Pour diverses raisons plutot vagues, les noms de methodes et de fonctions semblent 
plus lisibles lorsqu'ils sont entierement en minuscules. Par exemple, $obj-> 
en_chaine(). 

Vous pouvez faire preceder le nom d'un caractere souligne pour indiquer qu'une 
variable ou une fonction ne devrait pas etre utilisee hors du paquetage qui Fa defi- 
nie. (Perl ne force pas ceci ; ce n'est qu'une forme de documentation.) 

Dans le cas d'une expression reguliere reellement inextricable, utilisez le modifica- 
teur /x et inserez des espaces pour ameliorer le rapport signal/bruit. 

• N'employez pas de slash comme delimiteurs lorsque votre expression en comporte 
deja trop ou contient trop d'antislashs. 

• N'utilisez pas les apostrophes ou les guillemets comme delimiteurs lorsque votre 
chaine en contient deja. Utilisez plutot les pseudo-fonctions q//, qq// ou qx//. 

• Utilisez les operateurs and et or pour eviter de mettre trop de parentheses autour 
des operateurs de liste, et pour reduire l'incidence des operateurs de ponctuation 
comme && et | | . Appelez vos sous-programmes comme s'il s'agissait de fonctions ou 
d'operateurs de liste afin d'eviter un exces d'esperluettes et de parentheses. 

• Utilisez des documents « ici-meme » {here documents) au lieu d'instructions print 
repetees. 

• Alignez verticalement les choses correspondantes, surtout si elles sont trop longues 
pour tenir sur une ligne : 

$IDX = $ST_MTIME; 

$IDX = $ST_ATIME if $opt_u; 

$IDX = $ST_CTIME if $opt_c; 
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$IDX = $ST_SIZE if $opt_s; 

mkdir $rep_tmp, 0700 or die "mkdir $rep_tmp impossible : $!"; 
chdir($rep_tmp) or die "chdir $rep_tmp impossible : $!"; 

mkdir 'tmp', 0777 or die "mkdir $rep_tmp/tmp impossible : $!"; 

• Ce que nous vous repetons trois fois est vrai : 

Verifiez toujours les codes de retour des appels systeme. 
Verifiez toujours les codes de retour des appels systeme . 

VERIFIEZ TOUJOURS LES CODES DE RETOUR DES APPELS SYSTEME. 

• Les messages d'erreur devaient aller vers STDERR et devraient indiquer de quel pro- 
gramme provient l'erreur, ainsi que l'appel de fonction et les arguments. Le plus 
important est qu'ils devraient contenir, lorsque les appels systeme ont echoue, le 
message d'erreur systeme standard sur ce qui ne va pas. En voici un exemple simple 
mais suffisant : 

opendir(R, $rep) or die "opendir $rep impossible : $!"; 

• Alignez vos traductions si cela a un sens : 

tr [abc] 
[xyz]; 

• Pensez a la reutilisabilite. Pourquoi gacher votre energie cerebrale sur des scripts 
jetables alors que vous etes susceptible de les reecrire plus tard? Vous pouvez rendre 
votre code generique. Vous pouvez ecrire un module ou une classe d'objets. Vous 
pouvez faire toumer proprement votre code en activant use strict et -w. Vous 
pouvez donner votre code aux autres. Vous pouvez changer votre vision globale du 
monde. Vous pouvez. . . oh et puis tant pis. 

• Soyez coherent. 

• Soyez sympa. 

Perl avec aisance 

Nous avons aborde quelques idiomes dans les paragraphes precedents (pour ne pas citer 
les chapitres precedents) mais il y en a beaucoup d'autres que vous verrez couramment 
si vous lisez des programmes realises par des programmeurs Perl accomplis. Lorsque 
nous parlons de Perl idiomatique dans ce contexte, nous ne parlons pas seulement d'un 
ensemble arbitraire d'expressions Perl au sens fige. Nous parlons plutot de code Perl 
montrant une comprehension des meandres du langage, que vous pouvez avaler tel 
quel sans vous poser de question. Et quand l'avaler. 

Nous n'imaginons meme pas enumerer tous les idiomes que vous pourriez rencontrer 
— cela prendrait tout un livre, aussi epais que celui-ci. Et peut-etre meme deux. (Voir 
Perl en action, par exemple.) Mais voici quelques idiomes importants, ou Ton pourrait 
definir « important » comme « ce qui incite les persiflages des gens qui pensent deja 
savoir comment les langages informatiques devraient fonctionner ». 

• Utilisez => en lieu et place d'une virgule partout ou vous pensez que cela ameliore 
la lisibilite : 

return bless $pagaille => $classe; 
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Vous devez lire cela comme « Consacrer cette pagaille dans la classe specifiee. » Fai- 
tes juste attention a ne pas Femployer apres un mot dont vous ne voudriez pas qu'il 
soit automatiquement mis entre guillemets : 

sub trucQ { "TRUC" } 

sub machin() { "MACHIN"} 

print true => machin; # affiche trucMACHIN et non TRUCMACHIN. 
Un autre endroit approprie a l'emploi de => est a proximite d'une virgule litterale 
que Ton pourrait confondre visuellement : 

join(", " => @tableau); 
Perl vous offre plus d'une maniere de le faire (N.d.T. : There's More Than One Way To 
Do It, le slogan de Perl) vous pouvez done faire preuve de creativite. Faites-en 
preuve ! 

• Utilisez le pronom singulier pour ameliorer la lisibilite : 

for (@lignes) { 
$_ .= "\n"; 

} 

La variable $_ est la version de Perl d'un pronom et il signifie essentiellement 
« il »} Ainsi, le code ci-dessus signifie « pour chaque ligne, ajoutez-/u; un saut de 
ligne. » De nos jours, vous pouvez meme ecrire cela comme : 

$_ .= "\n" for @lignes; 
Le pronom $_ est tellement important pour Perl qu'il est obligatoire de l'utiliser 
dans grep et map. Void un moyen de configurer un cache pour les resultats com- 
muns d'une fonction couteuse : 

%cache = map { $_ => couteuse($_) } @args_communs; 

$xval = $cache{$x} | | couteuse($x); 

• Omettez le pronom pour ameliorer encore plus la lisibilite. 2 

• Utilisez des controles de boucles avec des modificateurs d'instructions. 

while (<>) { 

next if / A =pour\s+(index|apres)/; 
$cars += length; 
$mots += split; 
$lignes += y/\n//; 

} 

II s'agit d'un extrait de code que nous avons utilise pour compter les pages de ce 
livre. Lorsque vous vous appretez a travailler souvent avec la meme variable, il est 
souvent plus lisible de laisser completement tomber les pronoms, contrairement a 
la croyance populaire. 



1. N.d.T. : et puisqu'en francais, nous avons la chance de faire la difference entre les genres, il 
signifie egalement « elle ». De plus, comme la langue de Moliere nous a egalement fait cadeau 
d'une differenciation des pronoms selon leur fonction grammaticale, $_ peut finalement vouloir 
dire « il », « elle », « le », « la » ou « lui ». Pauvres anglo-saxons : ils n'ont pas plus d'une 
maniere de le dire ! 

2. Dans ce paragraphe, plusieurs items enumeres d'affilee se referent a l'exemple qui suit, puis- 
que certains de nos exemples illustrent plus d'un idiome. 
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Cet extrait demontre egalement l'utilisation idiomatique de next avec un modifica- 
teur d'instruction pour court-circuiter une boucle. 

La variable $_ est toujours la variable de controle de boucle dans grep et map mais 
la reference du programme pointant dessus est souvent implicite : 

$longueur_hachage = grep { length } (Saleatoire; 
Nous prenons ici une liste de scalaires aleatoires et ne choisissons que ceux qui ont 
une longueur superieure a 0. 

• Utilisez for pour positionner l'antecedent d'un pronom : 

for ($episode) { 
s/fred/barney/g; 
s/wilma/betty/g; 
s/pebbles/bambam/g; 

} 

Mais que se passe-t-il s'il n'y a qu'un seul element dans la boucle ? II s'agit d'un 
moyen pratique de positionner « le », c'est-a-dire $_. En linguistique, cela s'appelle 
une topicalisation. Ce n'est pas de la triche, c'est de la communication. 

Referencez implicitement le pronom pluriel, @>_. 

• Utilisez les operateurs de controle de flux pour fixer les valeurs par defaut : 

sub aboyer { 

my Chien $medor = shift; 

my $qualite = shift | | "jappant"; 

my $quantite = shift | | "sans_arret"; 

} 

Nous avons employe ici Fautre pronom de perl, @_, qui signifie « eux ». 3 Les argu- 
ments d'une fonction arrivent toujours comme « eux ». L'operateur shift sait qu'il 
doit travailler sur @_ si vous l'omettez, tout comme l'employe de Disneyland crierait 
« Au suivant ! » sans preciser quelle file d'attente est supposee avancer. (II n'y a pas 
lieu de specifier car il n'y a qu'une seule queue qui importe.) 
Le | | peut etre utilise pour fixer les valeurs par defaut malgre ses origines d'opera- 
teur booleen, puisque Perl renvoie la premiere valeur qui soit vraie. Les program- 
meurs Perl font souvent preuve d'une attitude assez cavaliere avec la verite ; la ligne 
ci-dessus ne fonctionnerait pas si, par exemple, vous essayiez de specifier une quan- 
tite nulle. Mais tant que vous ne voulez jamais positionner $qualite ou $quantite 
a une valeur fausse, l'idiome marche parfaitement. II n'y a pas lieu de devenir 
superstitieux et de lancer partout des appels a defined et exists. Tant que la valeur 
ne devient pas accidentellement fausse, tout ira bien. 

• Utilisez les formes d'affectation des operateurs, y compris les operateurs de controle 
de flux : 

$xval = $cache{$x} ||= couteuse($x); 
Ici nous n'initialisons pas du tout notre cache. Nous ne faisons que nous reposer 
sur l'operateur | | = pour appeler couteuse($x) et ne 1'afTecter a $cache{$x} que si 



3. ou « dies », ou « les », ou « leur », ou « eux ». 
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$cache{$x} est faux. Le resultat de ceci est la nouvelle valeur de $cache{$x} quelle 
qu'elle soit. Encore une fois, nous avons adopte une approche quelque peu cava- 
liere de la verite, en ce que si nous mettons en cache une valeur fausse, cou- 
teuse($x) sera a nouveau appelee. Le programmeur sait peut-etre que cela 
fonctionne car couteuse{$x} n'est pas couteuse lorsqu'elle renvoie une valeur 
fausse. Ou peut-etre que le programmeur a simplement tendance a bacler son tra- 
vail. Ce qui peut etre analyse comme une forme de creativite. 

• Utilisez les controles de boucles en tant qu'operateurs, pas seulement en tant 
qu'instructions. Et. . . 

• Utilisez les virgules comme de petits points-virgules : 

while (<>) { 

$commentaires++, next if / A #/; 
$blancs++, next if / A \s*$/; 

last if / A END / ; 

$code++; 

} 

print "commentaires = $commentaires\nblancs = $blancs\ncode = $code\n"; 
Ceci montre que nous comprenons que les modificateurs d'instructions modifient 
les instructions, alors que next est un simple operateur. Cela montre egalement 
que la virgule, lorsqu'elle est utilisee de facon idiomatique pour separer les expres- 
sions, exactement comme vous le feriez avec un point-virgule. (La difference est que 
la virgule garde les deux expressions comme faisant partie de la meme instruction, 
sous le controle de l'unique modificateur d'instruction.) 

• Utilisez le controle de flux a votre avantage : 

while (<>) { 

/ A #/ and $commentaires++; 

/ A s*$/ and $blancs++; 

/ A END / and last; 

$code++; 

} 

print "commentaires = $commentaires\nblancs = $blancs\ncode = $code\n"; 
II s'agit exactement de la meme boucle, seulement cette fois-ci, les motifs sont au 
debut. Le programmeur Perl perspicace comprend que la compilation donne exac- 
tement le meme code interne que l'exemple precedent. Le modificateur if n'est 
qu'une conjonction and (ou &&) inversee et le modificateur unless est une conjonc- 
tion or (ou | | ) inversee. 

• Utilisez les boucles implicites fournies par les options -n et -p. 

• Ne mettez pas de point-virgule a la fin d'un bloc d'une seule ligne : 

#! /usr/bin/perl -n 

$commentaires++, next LINE if / A #/j 

$blancs++, next LINE if / A \s*$/; 

last LINE if / A END / ; 

$code++; 



END {print "commentaires = $commentaires\nblancs = $blancs\ncode = 
$code\n" } 
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II s'agit essentiellement du mime programme que precedemment. Nous avons mis 
une etiquette LINE (LICNE en anglais) explicite dans les operateurs de contrdle de 
boucle parce que nous en avions envie mais nous n'y etions pas obliges, puisque la 
boucle LINE implicite, fournie par -n est la boucle encadrante la plus interieure. 
Nous avons employe END pour avoir l'instruction print finale a l'exterieur de la 
boucle principale implicite, exactement comme dans aw k. 

• Utilisez des documents « ici-meme » (here documents) lorsque les affichages devien- 
nent monstrueux. 

• Utilisez un delimiteur significatif dans les documents « ici-meme » : 

END { print <<"COMPTEURS" } commentaires = $commentaires 
blancs = $blancs 
code = $code 
COMPTEURS 

Au lieu d'utiliser plusieurs print, le programmeur parlant Perl couramment 
emploie une chaine multiligne avec interpolation. Bien que nous ayons appele ceci 
une « etourderie courante » auparavant, nous avons effrontement enleve le point- 
virgule final car il n'est pas necessaire a la fin du bloc END. (Si nous le changeons un 
jour en bloc multiligne, nous remettrons le point-virgule.) 

• Faites des substitutions et des traductions en passant 4 sur un scalaire : 

($nouveau = $ancien) =~ s/mauvais/bon/g; 
Puisque les lvalues sont lvaluables 5 , pour ainsi dire, vous verrez souvent les gens 
changer une valeur en passant alors qu'elle est en train d'etre affectee. Ceci peut en 
fait eviter une copie de chaine en interne (si nous arrivons jamais a implementer 
l'optimisation) : 

chomp($reponse = <STDIN>); 
Toute fonction qui modifie un argument sur place peut utiliser l'astuce en passant. 
Mais attendez, il y a mieux ! 

Ne vous limitez pas a modifier les scalaires en passant : 

for (@nouveau = @ancien) { s/mauvais/bon/g } 
Ici, nous copions @ancien dans @nouveau, en modifiant tout en passant (pas tout 
d'un coup, bien entendu — le bloc est execute de maniere repetitive, un « il » 
(c'est-a-dire $_) a la fois). 

• Passez les parametres nommes en utilisant l'operateur virgule de fantaisie, =>. 

• Fiez-vous a l'affectation a un hachage pour traiter un argument pair/impair : 

sub aboyer { 

my Chien $medor = shift; 
my %param = @_ 



4. N.d.T. : en francais dans le texte. 

5. N.d.T. : les lvalues sont des valeurs (values, en anglais) que Ton peut mettre a gauche (left, en 
anglais) d'une affectation. II y a done ici un jeu de mots que Ton peut traduire litteralement par 
« puisque les valeurs que Ton peut mettre a gauche d'une affectation peuvent etre mises a gauche 
d'une affectation. » 
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my $qualite = $param{QUALlTE} | | "jappant"; 
my $quantite = $param{OUANTITE} j j "sans_arret"; 



} 



$fido->aboyer( OUANTITE => "une_fois", 
OUALITE => "ouaf" ); 



Les parametres nommes sont souvent un luxe abordable. Et avec Perl, vous les avez 
pour rien, si vous ne comptez pas le cout de l'affectation de hachage. 

• Repetez les expressions booleennes jusqu'a obtenir une valeur fausse. 

• Utilisez les recherches de correspondances minimales lorsqu'elles sont appropriees. 

• Utilisez le modificateur /e pour evaluer une expression de remplacement : 

#! /usr/bin/perl -p 

1 while s/ A (.*)?(\t+)/$l . ' ' x length($2) *4 - length($l) %4)/e; 
Ce programme corrige tout fichier que vous recevez de la part de quelqu'un pen- 
sant par erreur qu'il peut redefinir les tabulations materielles pour qu'elles occu- 
pent 4 espaces au lieu de 8. II utilise plusieurs idiomes importants. Tout d'abord, 
l'idiome 1 while est commode lorsque tout le travail que vous voulez accomplir 
dans la boucle est en fait deja realise par la condition. (Perl est assez malin pour ne 
pas vous avertir que vous etes en train d'utiliser 1 dans un contexte vide.) Nous 
devons repeter cette substitution car chaque fois que nous remplacons un certain 
nombre d'espaces par des tabulations, nous devons recalculer depuis le debut la 
colonne oil doit se trouver la prochaine tabulation. 

Le ( .*?) correspond a la plus petite chaine possible jusqu'a la premiere tabulation, 
en utilisant le modificateur de correspondance minimal (le point d'interrogation). 
Dans ce cas, nous aurions pu utiliser un * gourmand comme d'ordinaire, ainsi : 
([ A \t]*). Mais cela ne marche que parce qu'une tabulation est un seul caractere, 
nous avons done employe une classe de caracteres avec une negation pour eviter de 
depasser la premiere tabulation. En general, la correspondance minimale est plus 
elegante et elle n'echoue pas si la prochaine chose qui doit correspondre fait plus 
d'un caractere. 

Le modificateur /e realise une substitution en utilisant une expression plutot 
qu'une chaine. Cela nous permet d'effectuer les calculs dont nous avons besoin au 
moment exact oil nous en avons besoin. 

• Utilisez une mise en page et des commentaires creatifs pour les substitutions com- 
plexes : 

#! /usr/bin/perl -p 



1 while s{ 



A 



) 



) 
( 



( 



\t+ 



*? 



# attachement au debut 

# commence le premier regroupement 

# correspond au nombre de caracteres minimal 

# termine le premier regroupement 

# commence le second regroupement 

# correspond a une ou plusieurs tabulations 

# termine le second regroupement 



} 
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{ 

my $lg_espaces = length($2) * 4; # comptage des tabulations 

# completes 

$lg_espaces -= length($l) % 4; # longueur de la tabulation 

# incomplete 

$1 . ' ' x $lg_espaces; # calcule le nombre d'espaces 

# correct 

}ex; 

Nous en faisons probablement un peu trop mais certaines personnes trouvent cet 
exemple plus impressionnant que le precedent qui tenait sur une seule ligne. A 
vous de voir. 

• Allez de l'avant et utilisez $ ' si vous le sentez : 

1 while s/(\t+)/' ' x (length($i) * 4 - length($ r ) % 4)/e; 
II s'agit ici d'une version plus courte, qui utilise $', bien connu pour son impact sur 
les performances. Sauf que nous n'utilisons que sa longueur, alors ca ne compte pas 
vraiment. 

• Utilisez les decalages directement a partir des tableaux @- (@LAST_MATCH_START) et 
@+ (@LAST_MATCH_END) : 

1 while s/\t+/' ' x (($+[0] - $-[0]) * 4 - $-[0] % 4)/e; 
Cet exemple-ci est encore plus court. (Si vous ne voyez pas de tableaux ici, essayez a 
la place de rechercher des elements de tableaux.) Voir @- et @+ au chapitre 28. 

• Utilisez eval avec une valeur de retour constante : 

sub est_un_motif_valide { 
my $motif = shift; 

return eval { "" =~ /$motif/; 1 } | | 0; 

} 

Vous n'avez pas a utiliser Foperateur eval {} pour renvoyer un valeur reelle. Ici, 
nous renvoyons toujours 1 si la correspondance parvient a se terminer. Toutefois, si 
le motif contenu dans $motif explose, Feval intercepte ceci et renvoie undef a la 
condition booleenne de l'operateur | | , qui transforme cela vers la valeur definie 0 
(simplement pour etre poli, puisque undef est egalement faux mais pourrait con- 
duire quelqu'un a penser que la routine est_un_motif_valide s'est mal comportee 
et nous ne voudrions pas que cela se produise, n'est-ce pas ?). 

• Utilisez des modules pour faire le sale boulot. 

• Utilisez des usines d'objets. 

• Utilisez des fonctions de rappel (callbacks). 

• Utilisez des piles pour garder une trace du contexte. 

• Utilisez des indices negatifs pour acceder a la fin d'un tableau ou d'une chaine : 

use XML: : Parser; 

$p = new XML::Parser Style => 'subs'; 

setHandlers $p Char => sub { $sorties[-l] .= $_[l] }; 

push (SisortieSj ""; 
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sub literal { 

$sorties[-l] .= "C<"; 
push (Ssorties, ""; 

} 

sub literal_ { 

my $texte = pop (Ssorties; 
$sorties[-l] .= $texte . ">"; 

} 

II s'agit d'un court extrait cl'un programme de 250 lignes que nous avons utilise 
pour retraduire la version XML de l'ancienne edition de ce livre 6 en format pod 
afin que nous puissions l'ouvrir pour la presente edition dans un Veritable Editeur 
de Texte. 

La premiere chose que vous remarquerez est que nous nous appuyons sur le 
module XML:: Parser (de CPAN) pour analyser notre XML correctement, nous 
n'avons done pas a comprendre comment le faire. Cela soulage deja notre pro- 
gramme de quelque milliers de lignes (en supposant que nous reimplementions en 
Perl tout ce que XML: : Parser accomplit pour nous, 7 y compris la traduction de 
presque tous les ensembles de caracteres vers de l'UTF-8). 

XML: : Parser utilise un idiome de haut niveau appele une usine d'objets. Dans ce cas, 
il s'agit d'une usine d'analyseur. Lorsque nous creons un objet XML: : Parser, nous 
lui disons quel style d'interface d'analyseur nous voulons et il en cree un pour 
nous. C'est un excellent moyen de construire une plate-forme de test pour une 
application lorsque vous n'etes pas sur de savoir quelle interface sera la meilleure a 
long terme. Le style subs ne represente qu'une des interfaces de XML: : Parser. En 
fait, il s'agit de l'une des plus anciennes interface et probablement pas la plus popu- 
late de nos jours. 

La ligne setHandlers montre un appel de methode sur l'analyseur, pas en notation 
flechee, mais dans la notation « d'objet indirect », qui vous permet, entre autres, 
d'omettre les parentheses autour des arguments. La ligne utilise egalement l'idiome 
des parametres nommes que nous avons vu plus tot. 

La ligne montre egalement un autre concept tres puissant, la notion de fonction de 
rappel (callback). Plutot que d'appeler l'analyseur pour obtenir l'element suivant, 
nous lui demandons de nous appeler. Pour les balises XML nominees, comme 
<literal>, ce style d'interface appellera automatiquement un sous-programme de 
ce nom (ou le nom avec un souligne a la fin pour la balise fermante correspon- 
dante). Mais les donnees entre les balises n'ont pas de nom, nous configurons done 



6. N.d.T. : le « Camel book » (litteralement le livre au chameau) est le surnom couramment 
employe par les fans de Perl (les Perl Mongers) pour designer le livre que vous avez entre les mains 
ainsi que ses illustres ancetres. Bien entendu, ceci est du au dessin de la couverture (heu... c'est en 
fait un dromadaire, voir le Colophon). Selon les recherches approfondies des Perl Mongers, le 
chameau de cette troisieme edition porte le doux nom d'Amelia, alors que celui de la precedente 
edition se prenommait Fido. 

7. En fait, XML : : Parser n'est qu'un enrobage pratique autour de l'analyseur XML expat de James 
Clark. 
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une fonction de rappel, Char, avec la methode setHandlers. 
Ensuite, nous initialisons le tableau @sorties, qui est une pile des affichages. Nous 
y mettons une chaihe vide pour representer le fait que nous n'avons collecte aucun 
texte a ce niveau d'imbrication des balises (0, initialement). 

C'est maintenant que reapparait la fonction de rappel. Des que nous voyons un 
texte, il est automatiquement ajoute apres l'element final du tableau, via l'idiome 
$sortie[ -l] dans la fonction de rappel. Au niveau de balise le plus exterieur, $sor- 
ties[-l] est equivalent a $sortie[o], $sorties[o] termine done notre affichage 
complet. (Eventuellement. Mais nous devons d'abord traiter les balises.) 
Supposez que nous voyions une balise <literal>. Alors le sous-programme lite- 
ral est appele, ajoute du texte a Faffichage courant, puis pousse un nouveau con- 
texte dans la pile @sorties. Des lors, tout texte rencontre jusqu'a la balise fermante 
se voit ajoute a cette nouvelle fin de la pile. Lorsque nous rencontrons la balise fer- 
mante, nous depilons (avec pop) le $texte que nous avons collecte hors de la pile 
@sorties et nous ajoutons le reste des donnees metamorphosees a la nouvelle 
(e'est-a-dire, l'ancienne) fin de la pile, dont le resultat est la traduction de la chame 
XML, <literal>rexre</literal>, vers la chame pod correspondante, C<texte>. 
Les sous-programmes pour les autres programmes sont exactement les mimes, a 
part qu'ils sont differents. 

• Utilisez my sans affectation pour creer un tableau ou un hachage vide. 

• Eclatez la chame par defaut selon les espaces qu'elle contient. 

• Affectez aux listes de variables pour en collecter autant que vous voulez. 

• Utilisez l'autovivification des references indefinies pour les creer. 

• Autoincrementez les elements indefinis de tableau ou de hachage pour les creer. 

• Utilisez Fautoincrementation d'un hachage %vus pour determiner l'unicite. 

• Affectez a une variable temporaire my bien pratique dans la condition. 

• Utilisez le comportement de protection automatique des accolades. 

• Utilisez un mecanisme de protection alternatif pour interpoler les guillemets. 

• Utilisez l'operateur ? : pour choisir entre deux arguments d'un printf. 

• Alignez verticalement les arguments de printf avec leur champ % : 

my %vus; 
while (<>) { 

my ($a, $b, $c) = split; 

print unless $vus{$a}{$b}{$c}++; 

} 

if (my $tmp = $vus{nifnif }{nafnaf }{noufnouf }) { 

printf qq("nifnif nafnaf noufnouf" vu %d coup%s\n), 

$tmp, $tmp == l ? "" : "s"; 

} 

Ces neuf lignes debordent d'idiomes. La premiere ligne donne un hachage vide car 
nous n'y affectons rien. Nous parcourons iterativement les lignes entrees en posi- 
tionnant « le », e'est-a-dire $_, implicitement, puis nous utilisons un split sans 
arguments qui « F » eclate selon les espaces qu'« il » contient. Ensuite nous pre- 



582 



Chapitre 24 — Techniques couramment employees 



nons les trois premiers mots avec une affectation de liste, en rejetant les mots sui- 
vants. Puis nous memorisons les trois premiers mots dans un hachage a trois 
dimensions, qui cree automatiquement (si necessaire) les deux premiers elements 
de reference et le dernier element de comptage pour l'autoincrementation a incre- 
menter. (Avec use warnings, l'autoincrementation ne vous avertira jamais que 
vous utilisez des valeurs indefinies car l'autoincrementation est un moyen accepte 
pour definir des valeurs indefinies.) Nous imprimons alors la ligne si nous n'en 
avons jamais vue avant commencant par ces trois mots, car l'autoincrementation 
est une postincrementation, qui, en plus d'incrementer la valeur du hachage, ren- 
verra l'ancienne valeur vraie s'il y en avait une. 

Apres la boucle, nous testons %vus a nouveau pour voir si une combinaison parti- 
culiere de trois mots a ete vue. Nous utilisons le fait que nous pouvons mettre un 
identificateur litteral entre accolades pour qu'il soit automatiquement protege, 
comme avec des guillemets. Sinon, nous aurions du ecrire $vus{"nafnaf "} 
{"nifnif "}{"noufnouf "}, ce qui est une corvee meme lorsque vous n'etes pas 
poursuivi par un grand mechant loup. 

Nous affectons le resultat de $vus{nif nif }{naf naf }{nouf nouf } a une variable tem- 
poraire avant meme de la tester dans le contexte booleen fourni par le if. Comme 
l'affectation renvoie sa valeur de gauche, nous pouvons toujours tester la valeur 
pour voir si elle etait vraie. Le my vous fait sauter aux yeux qu'il s'agit d'une nou- 
velle variable et que nous ne verifions pas une egalite mais realisons une affecta- 
tion. Cela aurait egalement parfaitement marche sans le my et un programmeur 
Perl expert aurait encore remarque immediatement que nous utilisions un = au 
lieu de deux ==. (Un programmeur Perl intermediate aurait cependant pu etre 
bluffe. Le programmeur Pascal de n'importe quel niveau aura de Fecume aux 
levres.) 

Si l'on passe a l'instruction printf, vous pouvez voir la forme qq() des guillemets 
que nous avons employee afin de pouvoir interpoler les guillemets ordinaires ainsi 
que le retour a la ligne. Nous aurions aussi bien pu interpoler directement ici $tmp, 
puisqu'il s'agit effectivement d'une chaine entre guillemets mais nous avons choisi 
de pousser plus loin l'interpolation via printf. Notre variable temporaire $tmp est 
maintenant bien pratique, particulierement depuis que nous ne voulons plus seule- 
ment l'interpoler mais egalement la tester dans la condition d'un operateur ? : 
pour voir si nous devions mettre le mot « coup » au pluriel. Enfin, remarquez que 
nous avons aligne verticalement les deux champs avec leur marqueurs % correspon- 
dants dans le format de printf. Si un argument est trop long pour coihcider, vous 
pouvez toujours aller a la ligne suivante pour l'argument suivant bien que nous 
n'ayons pas eu a le faire dans ce cas. 

Wouah ! Vous en avez assez ? II existe encore beaucoup d'autres idiomes dont nous 
aurions pu debattre mais ce livre est deja suffisamment lourd. Mais nous aimerions en- 
core parler d'un usage idiomatique de Perl, l'ecriture de generateurs de programmes. 

G merer des programmes 

Depuis le jour, ou presque, oil les gens se sont apercus pour la premiere fois qu'ils pou- 
vaient ecrire des programmes, ils ont commence a ecrire des programmes qui ecrivaient 
d'autres programmes. Nous les appelons souvent des generateurs de programmes. (Les his- 
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toriens se souviennent que RPG signifiait Report Program Generator bien avant Role 
Playing Game.) De nos jours, on le appellerait probablement des « usines a 
programmes » mais les gens des des generateurs sont arrives les premiers, c'est done leur 
nom qui a prevalu. 

Quiconque a deja ecrit un generateur de programmes sait que cela peut vous donner un 
strabisme divergent quand bien meme vous portez des verres correcteurs. Le probleme 
vient de ce qu'une grande partie des donnees du programme ressemble a du code, a la 
couleur du code, mais n'est pas du code (du moins pas encore). Le meme fichier texte 
contient a la fois des choses qui font quelque chose et des choses qui y ressemblent mais 
qui ne font rien. Perl comporte de nombreuses fonctionnalites qui facilitent son inte- 
gration avec d'autres langages, textuellement parlant. 

(Bien star, ces fonctionnalites facilitent Fecriture de Perl en Perl, mais c'est le moins 
auquel on puisse s'attendre des a present.) 

Generer d'autres langages en Perl 

Perl est (entre autres) un langage de traitement de texte et la plupart des langages infor- 
matiques sont textuels. De plus, l'absence de limites arbitraires et les divers mecanismes 
de protection et d'interpolation de Perl facilitent la separation visuelle du code d'un 
autre langage que Ton genere. Par exemple, voici un petit morceau de s2p, le traducteur 
sed-vers-perl : 

print &q(< <"FIN"); 

: #!$bin/perl 

: eval 'exec $bin/perl -S \$0\${l+"\$@"}' 

: if \$lance_sous_un_shell; 

FIN 

II se trouve que le texte encadre est legal en deux langages, Perl etsh. Nous avons utilise 
des le debut un idiome qui preservera votre sante mentale lors de Fecriture d'un gene- 
rateur de programme : Fastuce de mettre un caractere « de bruit » et une tabulation au 
debut de chaque ligne protegee, ce qui isole visuellement le code inclus, vous pouvez 
ainsi dire en un clin d'ceil qu'il ne s'agit pas du code qui est en train de s'executer. Une 
variable, $bin, est interpolee en deux endroits de la chaine multiligne protegee, puis la 
chaine est passee a travers une fonction qui elimine le deux-points et la tabulation. 

Bien sur, il est inutile d'utiliser des chaines protegees multilignes. On voit souvent des 
scripts CGI contenant des millions d'instructions print, une par ligne. C'est un peu 
comme aller au supermarche en Mirage III, mais bon, tant que l'on arrive a destina- 
tion... (Nous admettrons qu'une colonne d'instructions print possede ses propres pro- 
prietes pour ressortir visuellement.) 

Lorsque vous encadrez une grosse chaine protegee multiligne contenant un autre lan- 
gage (comme du HTML), il est parfois utile de faire comme si vous programmiez a l'en- 
vers, en encadrant plutot du Perl dans Fautre langage, exactement comme vous le feriez 
avec des langages ouvertement inverses comme PHP : 

print «"XML"; 
<truc> 
<insense> 
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bla bla bla @{[ scalar EXPR ]} bla bla bla 
bla bla bla @{[ LISTE ]} bla bla bla 
</insense> 
</truc> 

XML 

Vous pouvez utiliser l'une de ces deux astuces pour interpoler des valeurs d'expressions 
arbitrairement complexes dans une grosse chaine. 

Certains generateurs de programmes ne ressemblent pas beaucoup a des generateurs de 
programmes, selon la quantite d'operations qu'ils vous cachent. Au chapitre 22, CPAN, 
nous avons vu comment un petit programme Makefile.PL pouvait etre utilise pour ecri- 
re un Makefile. Makefile peut facilement etre 100 fois plus gros que le Makefile.PL qui Fa 
genere. Pensez a l'usure que cela epargne a vos doigts. Ou n'y pensez plus — apres tout, 
c'est le but. 

Generer du Perl dans d'autres langages 

II est facile de generer d'autres langages en Perl, mais l'inverse est egalement vrai. Perl 
peut facilement etre genere par d'autres langages parce qu'il est a la fois concis et mal- 
leable. Vous pouvez choisir votre maniere de proteger les chames entre guillemets afin 
de ne pas interferer avec les mecanismes de protection des autres langages. Vous n'avez 
pas a vous soucier de l'indentation, ni ou placer vos ruptures de lignes, ni si vous devez 
(encore) mettre un antislash avant vos antislashs. Vous n'avez pas besoin de definir un 
paquetage a l'avance par une seule chaine de caracteres, puisque vous pouvez glisser 
dans l'espace de noms du paquetage de facon repetee a chaque fois que vous voulez eva- 
luer plus de code dans ce paquetage. 

Une autre chose qui facilite l'ecriture de Perl dans d'autres langages (y compris Perl) est 
la directive #line. Perl sait comment la traiter comme une directive speciale qui recon- 
figure l'idee qu'il se faisait du nom de fichier courant et du numero de ligne. Ceci peut 
s'averer utile dans les messages d'erreur ou d'avertissement, en particulier pour les chai- 
nes traitees avec eval (ce qui, lorsqu'on y pense, n'est rien d'autre que du Perl ecrivant 
du Perl). La syntaxe de ce mecanisme est celle utilisee par le preprocesseur C : lorsque 
Perl rencontre un symbole # et le mot line, suivi par un numero et un nom de fichier, 
il positionne LINE a ce numero et FILE a ce nom de fichier. 8 

Voici quelques exemples que vous pouvez tester en tapant dans perl directement. Nous 
avons employe un Ctrl-D pour indiquer la fin de fichier, ce qui est typique d'Unix. Les 
utilisateurs de DOS/Windows et de VMS peuvent taper Ctrl-Z. Si votre shell utilise autre 
chose, vous devrez l'employer pour dire a perl que vous avez termine. Sinon, vous pou- 
vez toujours taper END pour dire au compilateur qu'il n'y a plus rien a analyser. 

Voici comment la fonction interne de Perl, warn, affiche le nouveau nom de fichier est 
le numero de ligne : 



8. Techniquement parlant, Perl fait une correspondance avec le motif 
/ A #\\s*line\\s+(\\d+)\\s*(?:\\s"([ A "]+)")?\\s*$/, avec $1 fournissant le numero de ligne 
pour la ligne suivante et $2 le nom de fichier optionnel specifie entre les guillemets. (Un nom de 
fichier vide laisse FILE inchange.) 
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% perl 

# line 2000 "Odyssee" 

# le "#" sur la ligne precedente doit etre le premier caractere de la ligne 
warn "les portes du compartiment pod"; # or die 

A D 

les portes du compartiment pod at Odyssee line 2001. 

Ici, Fexception levee par le die a l'interieur de Feval retrouve ses petits dans la variable 

$@ ($EVAL ERROR), accompagnee du nouveau nom de fichier temporaire et du numero 

de ligne : 

# line 1996 "Odyssee" 
eval qq { 

#line 2025 "Hal" 

die "portes du compartiment pod"j 

h 

print "Problemes avec 

warn "D'ai peur de ne pouvoir faire cela", 
A D 

Probleme avec les portes du compartiment pod at Hal line 2025. 
D'ai peur de ne pouvoir faire cela at Odyssee line 2001. 

Ceci montre comment une directive #line n'affecte que l'unite de compilation couran- 
te (le fichier ou l'eval CHAINE) et que, lorsque la compilation de cette unite est terminee, 
la configuration precedente est automatiquement restauree. De cette maniere vous 
pouvez positionner vos propres messages a l'interieur d'un eval CHAINE ou d'un do FI- 
CHIER sans affecter le reste de votre programme. 

Perl possede une option -P qui invoque le preprocesseur C, qui emet les directives 
#line. Le preprocesseur C etait l'elan initial pour implementer #line, mais il est rare- 
ment utilise de nos jours, depuis qu'il existe de meilleurs moyens pour faire ce pour 
quoi nous nous reposions sur lui. Perl possede toutefois de nombreux autre preproces- 
seurs, y compris le module AutoSplit. Le preprocesseur JPL (Java Perl Lingo) change les 
fichiers Jpl en fichiers Java, .pi, .h et .c. II utilise #line pour conserver la precision des 
messages d'erreurs. 

Un des tous premiers preprocesseurs de Perl etait le traducteur sed-vers-perl, s2p. En fait 
Larry a retarde la premiere version de Perl pour terminer s2p et awk-vers-perl (a2p) car 
il pensait qu'ils amelioraient la maniere dont Perl serait percu. Hum, peut-etre que cela 
a ete le cas. 

Voir les documentations en ligne pour plus d'information a ce sujet, ainsi que sur le tra- 
ducteur find2perl. 

Filtres de code source 

Si vous savez ecrire un programme pour traduire des choses quelconques en Perl, alors 
pourquoi ne pas disposer d'un moyen pour invoquer ce traducteur depuis Perl ? 

La notion de filtre de code source est nee avec l'idee qu'un script ou un module devrait 
etre capable de se decrypter lui-meme a la volee, comme ceci : 

#!/usr/bin/perl 

use MonFiltreDeDecryptage; 
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Mais l'idee a evolue depuis et maintenant un filtre de code source peut etre defini pour 
faire toutes les transformations que vous desirez sur un texte en entree. Mettez ceci en 
rapport avec la notion d'option -x mentionnee au chapitre 19, ^interface de la ligne de 
commande, et vous obtiendrez un mecanisme general pour extraire d'un message n'im- 
porte quel morceau de programme et pour l'executer, independamment du fait qu'il 
soit ecrit ou non en Perl. 

En utilisant le module Filter de CPAN, on peut meme maintenant faire des choses 
comme programmer du Perl en awk : 

#!/usr/bin/perl 

use Filter: :exec "a2p"; # le traducteur awk-vers-perl 

1,30 { print $1 } 

Maintenant voila precisement ce que vous pourriez qualifier d'idiomatique. Mais nous 
ne pretendons pas une seule seconde qu'il s'agit d'une technique couramment em- 
ployee. 



25 

Portabilite 



Un monde ne comportant qu'un seul systeme d'exploitation rendrait la portability faci- 
le et la vie ennuyeuse. Nous preferons un large champ genetique de systemes d'exploi- 
tations, tant que l'ecosysteme ne se divise pas trop clairement en predateurs et en proies. 
Perl tourne sur des douzaines de systemes d'exploitation et puisque les programmes 
Perl ne sont pas dependants de la plate-forme, le mime programme peut tourner sur 
tous ces systemes sans modification. 

Enfin, presque. Perl essaie d'offrir au programmeur autant de fonctionnalites que pos- 
sible mais si vous utilisez des fonctionnalites specifiques a un certain systeme d'exploi- 
tation, vous reduirez forcement la portabilite de votre programme sur d'autres 
systemes. Dans ce paragraphe, nous donnerons quelques lignes de conduite pour ecrire 
du code Perl portable. Une fois que vous aurez pris votre decision sur le degre de porta- 
bilite que vous souhaitez, vous saurez ou tirer un trait et vous saurez quelle limites vous 
decidez de ne pas franchir. 

Si Ton regarde sous un autre angle, l'ecriture de code portable entraine une limitation 
volontaire des choix disponibles. II n'existe aucune raison pour ne pas utiliser Perl pour 
lier ensemble des outils Unix, ou pour prototyper une application Macintosh, ou pour 
gerer la base de registre de Windows. Si cela a un sens de sacrifier la portabilite, allez-y. 1 

En general, remarquez que les notions de UID, de repertoire « maison » et meme l'etat 
d'etre « logue » n'existeront que sur des plates-formes multiutilisateur. 

La variable speciale $ A 0 vous indique sur quel systeme d'exploitation Perl a ete compile. 
Ceci permet d'accelerer le code qui autrement aurait du faire use Conf ig pour obtenir 
la meme information via $Config{osname}. (Meme si vous avez charge Config pour 
d'autres raisons, cela vous economise une recherche dans un hachage lie.) 



1. Toute conversation ne se doit pas d'etre multiculturellement exacte. Perl essaie de vous don- 
ner au moins une maniere de faire la Chose A Faire mais n'essaie pas de vous l'imposer stricte- 
ment. A cet egard, Perl se rapproche plus de votre langue maternelle que de la langue de votre 
nourrice. 
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Pour obtenir des informations plus detaillees sur la plate-forme, vous pouvez recher- 
cher le reste de l'information dans le hachage %Conf ig, qui est disponible grace au mo- 
dule standard Conf ig. Par exemple, pour verifier si la plate-forme dispose de l'appel 
lstat, vous pouvez tester $Conf ig{d_lstat}. Voir la documentation en ligne de Conf ig 
pour une description complete des variables accessibles et la page de manuel perlport 
pour une liste des comportements des fonctions internes de Perl sur differentes plates- 
formes. Voici les fonctions Perl dont le comportement varie le plus entre les plates-for- 
mes. 

-X (tests de fichiers), accept, alarm, bind, binmode, chmod, chown, chroot, connect, 
crypt, dbmclose, dbmopen, dump, endgrent, endhostent, endnetent, endprotoent, en- 
dpwent, endservent, exec, fcntl, fileno, flock, fork, getgrent, getgrgid, getgrnam, 
gethostbyaddr, gethostbyname, gethostent, getlogin, getnetbyaddr, getnetbyname, 
getnetent, getpeername, getpgrp, getppid, getpriority, getprotobyname, getproto- 
bynumber, getprotoent, getpwent, getpwnam, getpwuid, getservbyport, getservent, 
getservbyname, getsockname, getsockopt, glob, ioctl, kill, link, listen, lstat, ms- 
gctl, msgget, msgrcv, msgsnd, open, pipe, qx, readlink, readpipe, recv, select, semctl, 
semget, semop, send, sethostent, setgrent, setnetent, setpgrp, setpriority, setpro- 
toent, setpwent, setservent, setsockopt, shmctl, shmget, shmread, shmwrite, shu- 
tdown, socket, socketpair, stat, symlink, syscall, sysopen, system, times, truncate, 
umask, utime, wait, waitpid 

Sauts de ligne 

Sur la plupart des systemes d'exploitations, les lignes dans les fichiers sont terminees par 
un ou deux caracteres qui signalent la fin de ligne. Les caracteres varient d'un systeme a 
l'autre. Unix utilise traditionnellement \012 (c'est-a-dire le caractere octal 12 en ASCII), 
un type d'entrees/sorties a la DOS utilise \015\012 et les Mac utilisent \015. Perl em- 
ploie \n pour representer un saut de ligne « logique », independamment de la plate-for- 
me. Sur MacPerl, \n signifie toujours \015. Sur les Perl a la DOS, \n signifie 
generalement \012, mais lorsqu'on accede a un fichier en « mode texte », il est traduit 
vers (ou depuis) \015\012, selon que vous lisez ou que vous ecrivez. Unix fait la mime 
chose sur les terminaux en mode canonique. On se refere generalement a \015\012 en 
l'appelant CRLE 

Comme DOS fait une distinction entre les fichiers texte et les fichiers binaires, les Perl 
a la DOS ont des restrictions sur l'utilisation de seek et tell sur un fichier en « mode 
texte ». Pour obtenir les meilleurs resultats possibles, ne faites seek que sur des empla- 
cements obtenus depuis tell. Si toutefois vous utilisez la fonction interne de Perl bin- 
mode sur le handle de fichier,vous pouvez generalement faire seek et tell en toute 
impunite. 

Un malentendu frequent dans la programmation de sockets est que \n vaudra \012 par- 
tout. Dans beaucoup de protocoles Internet habituels, \012 et \015 sont specifies et les 
valeurs de \n et \r de Perl ne sont pas fiables puisqu'elles varient d'un systeme a l'autre : 

print SOCKET "Salut, le client !\015\012"; # correct 
print SOCKET "Salut le client !\r\n"; # FAUX 

Toutefois, l'utilisation de \015\012 (ou \cM\cD, ou encore \xOD\xOA, ou mime V13.10) 
peut devenir penible et disgracieux, et semer la confusion chez ceux qui maintiennent 
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le code. Le module Socket fournit quelques Choses Correctes pour ceux qui en veulent : 
use Socket qw( : DEFAULT :crlf); 

print SOCKET "Salut le client !$CRLF" # correct 

Lors d'une lecture sur une socket, souvenez-vous que le separateur d'enregistrement 
d 'entree par defaut $/ est \n, ce qui signifie que vous avez encore du travail a faire si vous 
n'etes pas stirs que de ce que vous verrez a travers la socket. Un code de socket robuste 
devrait reconnaitre soit \012 ou \015\012 comme etant la fin de ligne : 

use Socket qw( : DEFAULT :crlf); 

local ($/) = LF # pas necessaire si $/ vaut deja /012 

while (<S0CKET>) { 

s/$CR?$LF/\n/; # remplace LF ou CRLF par un saut de ligne logique 

} 

De meme, un code renvoyant des donnees textuelles — comme un sous-programmes 
qui va chercher une page web — devrait souvent traduire les sauts de ligne. Souvent, 
une seule ligne de code suffit : 

$donnees =~ s/\015?\012/\n/g; 
return $donnees; 

Boutisme et taille des nombres 

Les ordinateurs stockent les entiers et les nombres a virgule flottante dans des ordres 
differents (gros-boutiste, big-endian ou petit-boutiste, little-endian) et dans des tailles diffe- 
rentes (32 bits et 64 bits etant les tailles les plus courantes de nos jours). Normalement, 
vous n'aurez pas a y penser. Mais si votre programme envoie des donnees binaires a tra- 
vers une connexion reseau ou s'il ecrit sur le disque des donnees destinees a etre lues par 
un ordinateur different, il se peut que vous deviez prendre des precautions 

Des ordres rentrant en conf lit peuvent semer une pagaille absolue dans les nombres. Si 
un note petit-boutiste (comme une CPU Intel) stocke 0x12345678 (305 419 896 en de- 
cimal), un hote grand-boutiste (comme une CPU Motorola) le lira comme 0x78563412 
(2 018 915 346 en decimal). Pour eviter ce probleme dans les connexions reseau (sur une 
socket), utilisez pack et unpack avec les formats n et N, qui ecrivent des nombres entiers 
courts et longs dans l'ordre gros-boutiste (egalement appele ordre « reseau ») quelle que 
soit la plate-forme. 

Vous pouvez explorer le boutisme de votre plate-forme en depaquetant une structure 
de donnees empaquetee en format natif, comme ceci : 

print unpack("h*", pack("s2", 1, 2)), "\n"; 

# '10002000' sur par ex. Intel x86 ou Alpha 21064 en mode petit-boutiste 

# '00100020' sur par ex. Motorola 68040 

Pour determiner votre boutisme, vous pourriez utiliser Fune de ces deux instructions : 

$est_gros_boutiste = unpack("h*", pack("s", l)) =~ /01/; 
$est_petit_boutiste = unpack("n*", pack("s", l)) =~ / A l/; 

Meme si deux systemes ont le meme boutisme, il peut encore y avoir des problemes lors 
du transfert de donnees entre des plates-formes 32-bits et 64-bits. II n'existe pas de bonne 
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solution autre que d'eviter de transferer ou de stacker des nombres binaires bruts. Soit 
vous transferez et vous stockez les nombres en texte plutot qu'en binaire, soit vous uti- 
lisez des modules comme Data: : Dumper ou Storable pour le faire a votre place. Vous 
avez tout interet a utiliser des protocoles orientes texte en toutes circonstantes — ils sont 
plus robustes, plus maintenables et encore plus extensibles que les protocoles binaires. 

Bien entendu, avec Favenement de XML et d'Unicode, notre definition d'un protocole 
oriente texte devient encore plus souple. Par exemple, vous pouvez transferer, entre 
deux systemes oil Perl 5.6.0 (ou une version ulterieure) est installe, une sequence d'en- 
tiers encodes en tant que caracteres en utf 8 (la version UTF-8 de Perl). Si les deux extre- 
mites tournent sur une architecture avec des entiers 64-bits, vous pouvez echanger des 
entiers 64-bits. Sinon, vous etes limites a des entiers 32-bits. Utilisez pack avec un cane- 
vas U* pour envoyer et unpack avec un canevas U* pour recevoir. 

Fichiers et systemes de fichiers 

Les composants des chemins de fichiers sont separes par / sur Unix, \ sur Windows et : 
sur Mac. Certains systemes n'implementent ni les liens en dur (link), ni les liens sym- 
boliques (symlink, readlink, lstat). Certains systemes attachent une importance a la 
casse (majuscules/minuscules) des noms de fichiers, d'autres non et d'autres encore n'y 
font attention que lors de la creation de fichiers mais pas lors de leur lecture. 

II existe des modules qui peuvent vous aider. Les modules standards File: :Spec four- 
nissent des fonctions qui Font La Bonne Chose : 

use File: :Spec: functions; 

chdir( updirQ ); # monter dans le repertoire superieur 

$fichier = catfile( curdir(), 'temp', 'fichier.txt'); 

La derniere ligne lit dans ./temp/ftchier.txt sur Unix et Windows ou :temp:fichier.txt sur 
Mac ou [.templfichier.txt sur VMS et stocke le contenu du fichier dans $f ichier. 

Le module File : : Basename, un autre module livre avec Perl qui est egalement indepen- 
dant de la plate-forme, eclate un nom de chemin en ses composants : le nom de fichier 
de base, le chemin complet vers le repertoire et le suffixe du fichier. 

Voici quelques astuces pour ecrire des programmes Perl manipulant des fichiers qui 
soient portables : 

• N'utilisez pas deux fichiers du mime nom avec des casses differentes, comme test.pl 
et Test.pl, puisque certaines plates-formes ignorent la casse. 

• Limitez vos noms de fichiers a la convention 8.3 (noms de huit lettres et extensions 
de trois lettres) partout ou c'est possible. Vous pouvez souvent vous en sortir avec 
des noms de fichiers plus longs pour autant que vous soyez surs qu'ils resteront uni- 
ques lorsqu'on les aura pousses a travers un trou dans le mur de taille 8.3. (He, cela 
s'avere plus facile que de pousser un chameau a travers le chas d'une aiguille.) 

• Reduire l'emploi de caracteres non alphanumeriques dans les noms de fichiers. 
L'utilisation de soulignes est souvent correcte mais elle gaspille un caractere qui 
pourrait etre mieux employe pour l'unicite sur les systemes 8.3. (Souvenez-vous 
que c'est la raison pour laquelle nous ne mettons habituellement pas de souligne 
dans les noms de modules.) 
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• De meme, lorsque vous utiliser le module AutoSplit, essayez de limiter vos noms 
de sous-programmes a huit caracteres au plus et ne donnez pas le meme nom avec 
une casse differente a deux sous-programmes. Si vous avez besoin de plus de huit 
caracteres, arrangez-vous pour qu'il y ait unicite sur les huit premiers. 

• Utilisez toujours < explicitement pour ouvrir un fichier en lecture ; sinon, sur les 
systemes qui autorisent la ponctuation dans les noms de fichiers, un fichier prefixe 
par un caractere > pourrait etre efface et un fichier prefixe par | pourrait engendrer 
une ouverture de pipe. Car la forme a deux arguments d'open est magique et elle 
interpretera les caracteres comme >, < et | , ce qui peut etre la mauvaise chose a 
faire. (Sauf si c'est la bonne). 

open(FICHIER, $f ichier_existant) or die $!; # MAUVAIS 

open(FICHIER, "<$fichier_existant) or die $!; # mieux 
open(FICHIER, "<", $f ichierexistant) or die $!; # encore mieux 

Ne presupposez pas que les fichiers texte finiront par un saut de ligne. lis le 
devraient, mais les gens oublient quelquefois, particulierement lorsque leur editeur 
de texte les y aide. 

Interactions avec le systeme 

Les plates-formes reposant sur une interface graphique sont parfois demunis de toute 
espece de ligne de commande, ainsi les programmes exigeant une interface en ligne de 
commande pourraient ne pas fonctionner partout. Vous n'y pouvez pas grand chose, a 
part mettre a jour. 

Quelques autres astuces : 

• Certaines plates-formes ne peuvent pas supprimer ou renommer des fichiers en 
train d'etre utilises, souvenez-vous done de fermer avec close les fichiers lorsque 
vous en avez fini avec eux. Ne faites pas unlink ou rename sur un fichier ouvert. Ne 
faites pas tie ou open sur un fichier deja lie avec tie ou deja ouvert ; faites d'abord 
untie ou close sur ce fichier. 

N'ouvrez pas le meme fichier plusieurs fois simultanement, car certains systemes 
posent d'office des verrous sur les fichiers ouverts. 

• Ne dependez pas d'une variable d'environnement specifique existant dans %ENV et 
ne presupposez pas que quoi que ce soit dans %ENV soit insensible a la casse ou pre- 
serve la casse. Ne presumez pas de la semantique de l'heritage d'Unix pour les 
variables d'environnement ; sur certains systemes, elles peuvent etre visibles par 
tous les processus. 

• N'utilisez pas les signaux, ni %SIG. 

• Tachez d'eviter les globs de noms de fichiers. Utilisez opendir, readdir et closedir 
a la place. (Depuis la version 5.6.0 de Perl, le glob basique de noms de fichiers est 
bien plus portable qu'il ne l'etait mais certains systemes peuvent encore se frotter 
aux « Unixismes » de l'interface par defaut si vous essayez d'etre original.) 

• Ne presumez pas des valeurs specifiques pour les numeros d'erreur ou les chaines 
stockees dans $ ! . 
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Communication interprocessus (IPC) 

Pour maximiser la portabilite, n'essayez pas de lancer de nouveaux processus. Cela signi- 
fie que vous devriez eviter system, exec, fork, pipe, ' ', qx// ou open avec un | . 

Le probleme principal ne reside pas dans les operateurs eux-memes : les commandes 
lancant des processus externes sont generalement implementees sur la plupart des pla- 
tes-formes (bien que certaines n'implementent aucun type de fork). Les problemes sont 
d'avantage susceptibles de se produire lorsque vous invoquez des programmes externes 
qui ont des noms, des emplacements, des sorties ou des semantiques pour les arguments 
qui varient entre les plates-formes. 

Un morceau de code Perl particulierement populaire est l'ouverture d'un pipe vers 
sendmail pour que votre programme puisse envoyer un mail : 

open(MAIL, ' | /usr/lib/sendmail -t') or die "fork sendmail impossible: $!"; 

Ceci ne marchera pas sur les plates-formes sans sendmail. Pour une solution portable, 
utilisez l'un des modules de CPAN pour envoyer votre mail, comme Mail: :Mailer et 
Mail : : Send dans la distribution MailTools ou Mail : : Sendmail. 

Les fonctions des IPC System V d'Unix (msg*(), sem*(), shm*()) ne sont pas toujours 
disponibles, meme sur certaines plates-formes Unix. 

Sous-programmes externes (XS) 

II est generalement possible d'elaborer un code XS pour qu'il fonctionne avec n'importe 
quelle plate-forme mais les bibliotheques et les fichiers d'en-tete pourraient ne pas etre 
disponibles partout. Si les bibliotheques et les fichiers d'en-tete sont portables, alors il 
y a une chance raisonnable pour que le code XS le soit egalement. 

Un probleme de portabilite different se produit lors de l'ecriture de code XS : la dispo- 
nibilite d'un compilateur C sur la plate-forme de l'utilisateur final. C apporte avec lui 
ses propres problemes de portabilite et l'ecriture de code XS vous exposera a certains 
d'entre eux. L'ecriture en Perl pur est un moyen facile d'atteindre la portabilite car le 
processus de configuration de Perl traverse des supplices extremes pour vous cacher les 
tares de portabilite du C. 2 

Modules standard 

En general, les modules standard (ceux qui sont livres avec Perl) fonctionnent sur toutes 
les plates-formes. Les exceptions notables sont le module CPAN . pm (qui realise en fait des 
connexions vers des programmes externes qui peuvent ne pas etre disponibles), les mo- 
dules specifiques a une plate-forme (comme ExtUtils: :MM_VMS) et les modules DBM. 

II n'existe pas un seul module DBM qui soit disponible sur toutes les plates-formes. 



2. Certaines personnes en marge de la societe lancent le script Configure de Perl comme une 
forme d'amusement bon marche. Certaines personnes sont meme connues pour organiser des 
« courses de Configure » entre des systemes concurrents et parient dessus de grandes sommes 
d'argent. Cette pratique est desormais hors-la-loi dans la majeure partie du monde civilise. 
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SDBM_File et les autres sont generalement disponibles sur tous les portages Unix et a la 
DOS mais pas dans MacPerl, oil seuls NBDM_File et DB_File sont disponibles. 

La bonne nouvelle est qu'au moins un module DBM devrait etre disponible et que 
AnyDBM_File utilisera n'importe quel module qu'il sera capable de trouver. Avec une tel- 
le incertitude, vous ne devriez utiliser que les fonctionnalites communes a toutes les im- 
plementations DBM. Par exemple, limitez vos enregistrements a 1 K octet, pas plus. 
Voir la documentation du module AnyDBM_File pour plus de details. 

Dates et heures 

La oil c'est possible, utilisez le standard ISO-8601 (« AAAA-MM-JJ ») pour representer les 
dates. Les chaines comme « 1971-06-21 » peuvent facilement etre converties vers une 
valeur specifique au systeme avec un module comme Date : : Parse. Une liste de valeurs 
de date et d'heure (comme celle renvoyee par la fonction interne localtime) peut etre 
convertie vers une representation specifique au systeme en utilisant Time: : Local. 

La fonction interne time renverra toujours le nombre de secondes depuis le commen- 
cement de P« epoch » (Forigine, voir la fonction time au chapitre 29) mais les systemes 
d'exploitation ont des opinions divergentes concernant la date a laquelle cela s'est pro- 
duit. Sur la plupart des systemes, Forigine est fixee au l er janvier 1970 a 00:00:00 UTC 
mais elle a commence 66 ans plus tot sur Mac et sur VMS elle a demarre le 17 novembre 
1858 a 00:00:00. Ainsi, pour obtenir des dates portables, vous voudrez peut-etre calculer 
un decalage pour Forigine : 

require Time: : Local; 

$decalage = Time: : Local: :timegm(0, 0, 0, 1, 0, 70); 

La valeur de $decalage sur Unix et Windows vaudra toujours 0 mais sur Macs et VMS, 
elle pourra valoir un nombre plus grand. II est alors possible d'ajouter $decalage a une 
valeur de date et d'heure Unix pour obtenir ce qui devrait etre la meme valeur sur tous 
les systemes. 

La representation par le systeme de Fheure du jour et de la date calendaire peut etre con- 
trolee par des moyens largement differents. Ne presupposez pas que le fuseau horaire 
soit stocke dans $ENV{TZ}. Et meme s'il Fest, ne presupposez pas que vous pouvez le con- 
troler via cette variable. 

Internationalisation 

Utilisez de FUnicode dans vos programmes. Faites toutes les conversions depuis et vers 
d'autres jeux de caracteres dans vos interfaces vers le monde exterieur. Voir le chapitre 
15, Unicode. 

En dehors du monde d'Unicode, vous devriez presumez de peu en ce qui concerne les 
jeux de caracteres et de rien du tout a propos des valeurs de ord pour les caracteres. Ne 
presupposez pas que les caracteres alphabetiques aient des valeurs de ord sequentielles. 
Les lettres minuscules peuvent venir avant ou apres les majuscules ; les majuscules et les 
minuscules peuvent etre melees de maniere a ce qu'a la fois a et A viennent avant b ; les 
caracteres accentues et les autres caracteres internationaux peuvent etre meles pour que 
a vienne avant b. 
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Si votre programme opere sur un systeme POSIX (une hypothese plutot large), consul- 
tez la page de manuel de perllocale pour plus d'informations sur les locales de POSIX. 
Les locales affectent les jeux de caracteres et les encodages ainsi que la date et l'heure, 
entre autres choses. Une utilisation correcte des locales rendra votre programme un peu 
plus portable ou au moins, plus pratique et nativement amical pour les utilisateurs non 
anglo-saxons. Mais soyez conscients que les locales et Unicode ne se melangent pas en- 
core tres bien. 

Style 

Lorsqu'il est necessaire d'avoir du code specifique a la plate-forme, pensez a le garder a 
un endroit qui facilite le portage vers d'autres plates-formes. Utiliser le module Conf ig 
et la variable speciale $ A 0 pour marquer les differences entre les plates-formes. 

Faites attention aux tests que vous fournissez avec votre module ou vos programmes. Le 
code d'un module peut etre totalement portable mais ses tests peuvent ne pas l'etre tout 
a fait. Ceci arrive souvent lorsque les tests engendrent d'autres processus ou appellent 
des programmes externes pour faciliter les controles ou lorsque (comme on l'a remar- 
que ci-dessus) les tests presument de certaines choses concernant le systeme de fichiers 
et les chemins. Prenez garde a ne pas dependre d'un style d'affichage specifique pour les 
erreurs, meme en verifiant $ ! pour les erreurs « standards » apres un appel systeme. Uti- 
lisez plutot le module Errno. 

Souvenez-vous qu'un bon style transcende a la fois le temps et les cultures, ainsi, pour 
une portabilite maximale, vous devez chercher a comprendre ce qui est universel par- 
mis les exigences de votre existence. Les personnes les plus equilibrees ne sont pas pri- 
sonnieres et n'ont pas a l'etre car elles ne se soucient pas d'etre a la mode en egard a leur 
propre culture, de programmation ou autre. La mode est variable mais le style est cons- 
tant. 
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Un des principes sous-jacents dans la conception de Perl est que les choses simples de- 
vraient rester simples et que les choses difficiles devraient etre possibles. La documenta- 
tion devrait rester simple. 

Perl implemente un format de balises simple appele pod qui peut avoir son existence 
propre ou etre librement entremele avec votre code source pour creer une documenta- 
tion inseree. Pod peut etre converti vers differents formats pour l'impression ou la con- 
sultation ou vous pouvez simplement le lire directement car il est a plat (plain en 
anglais). 

Pod n'est pas aussi expressif que des langages comme XML, LATEX, troff(\) ou meme 
HTML. C'est une volonte de notre part : nous avons sacrifie l'expressivite au profit de la 
simplicite et de la commodite. Certains langages a balises font ecrire aux auteurs plus 
de balises que de texte, ce qui rend l'ecriture plus difficile qu'elle ne l'etait et la lecture 
proche de l'impossible. Un bon format, comme une bonne musique de film, reste en 
arriere-plan sans distraire le spectateur. 

Amener les programmeurs a ecrire de la documentation est presque aussi difficile que 
de les amener a porter des cravates. Pod a ete concu pour etre si simple a ecrire que 
meme un programmeur puisse le faire — et il devrait le faire. Nous ne pretendons pas 
que pod est suffisant pour ecrire un livre, bien qu'il rut suffisant pour ecrire celui-ci. 

Pod en quelques mots 

La plupart des formats de document exigent que le document entier soit dans ce format. 
Pod est plus indulgent : vous pouvez inserer du pod dans tout type de fichier, en vous 
reposant sur les traducteurs de pod pour l'extraire. Certains fichiers sont entierement 
constitues de pod pur a 100 %. Mais d'autres, notamment les programmes Perl et les mo- 
dules, peuvent contenir une belle quantite de pod dispersee de-ci de-la au bon vouloir 
de Fauteur. II suffit a Perl de sauter le texte en pod lorsqu'il analyse le fichier en vue de 
l'executer. 

L'analyseur lexical de Perl sait oil commencer a sauter le pod lorsqu'a un certain endroit 
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oil il trouverait d'ordinaire une instruction, il rencontre a la place une ligne commen- 
cant par un signe egal et un identificateur, comme ceci : 

=headl Ici se trouvent les pods ! 

Ce texte, ainsi que tout ce qui se trouve jusqu'a et y compris une ligne commencant par 
=cut, sera ignore. Cela vous permet d'entremeler votre code source et votre documen- 
tation en toute liberte, comme dans : 

=item guinde 

La fonction guinde() se comportera de la facon la plus spectaculairement 
coincee que vous puissiez imaginer, avec aussi peu de naturel qu'une 
pyrotechnie cybernetique. 

=cut 

sub guinde() { 

my $arg = shift; 

} 

=item guincher 

La fonction guincherQ permet la generation autodidact d'epistemologie. 
=cut 

sub guincher { 

print "La generation d'epistemologie n'est pas implemented sur 
cette plate-forme. \n"; 

} 

Pour d'autres exemples, regardez dans n'importe quel module standard ou venant de 
CPAN. lis sont tous supposes venir avec du pod, et pratiquement tous le font, excepte 
ceux qui ne le font pas. 

Puisque le pod est reconnu par l'analyseur lexical de Perl et rejete, vous pouvez egale- 
ment utiliser une directive pod appropriee pour inhiber rapidement une section de 
code arbitrairement longue. Utilisez un bloc pod =f or pour inhiber un paragraphe ou 
une paire =begin/=end pour un section plus grosse. Nous detaillerons la syntaxe de ces 
directives pod plus tard. Souvenez-vous cependant que dans les deux cas, vous etes tou- 
jours dans le mode pod apres ceci, vous avez done besoin de faire un =cut pour revenir 
au compilateur. 

print "recu l\n"j 
=for comment 

Ce paragraphe seul est ignore par tout le monde sauf 
le mythique traducteur « comment » (N.d.t : commentaire) . 
Lorsque e'est fait, vous etes toujours en mode pod 
et non en mode programme. 
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print "recu 2\n"; 
=cut 

# ok, a nouveau dans le programme reel 

print "recu 3\n"; 

=begin commentaire 

print "recu 4\n"j 

tout ce qui se trouve ici 

sera ignore 

par tout le monde 

print "recu 5\n"; 

=end commentaire 

=cut 

print "recu 6\n"; 

Ceci affichera qu'on a recu 1, 3 et 6. Souvenez-vous que ces directives pod ne peuvent 
pas aller partout. Vous devez les mettre seulement la oil l'analyseur s'attend a trouver 
une nouvelle instruction, pas juste au milieu d'une expression, ni a d'autres endroits ar- 
bitraires. 

Du point de vue de Perl, tout ce qui est balise par pod est rejete mais du point de vue 
des traducteurs de pod, c'est le code qui est rejete. Les traducteurs de pod voient le texte 
qui reste comme une sequence de paragraphes separes par des lignes blanches. Tous les 
traducteurs de pods modemes analysent le pod de la mime maniere, en utilisant le mo- 
dule standard Pod: : Parser. lis ne se differencient que par leur sortie, puisque chaque 
traducteur se specialise dans un format de sortie. 

II existe trois sortes de paragraphes : les paragraphes « tels quels » (verbatim), les para- 
graphes de commandes et les paragraphes de prose. 

Paragraphes « tels quels » 

Les paragraphes « tels quels » sont utilises pour du texte litteral que vous voulez voir 
apparaitre tel qu'il est, comme des extraits de code. Un paragraphe « tel quel » doit etre 
indente ; c'est-a-dire qu'il doit commencer par un caractere espace ou de tabulation. Le 
traducteur devrait le reproduire exactement, generalement avec une fonte de largeur 
fixe, et en alignant les tabulations sur des colonnes de huit caracteres. II n'y a pas de for- 
matage special des sequences d'echappement, vous ne pouvez done pas jouer sur les fon- 
tes pour mettre en italique ou en relief. Un caractere < signifie un < litteral et rien 
d'autre. 
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Directives pod 

Toutes les directives pod commence par = suivi d'un identificateur. Ce dernier peut etre 
suivi par autant de texte arbitraire que la directive peut utiliser de quelque maniere qui 
lui plaise. La seule exigence syntaxique est que le texte doit etre tout entier dans un pa- 
ragraphe. Les directives actuellement reconnues (appelees parfois commandes pod) sont : 

=headl 
=head2 



Les directives =headl, =head2,... produisent des en-tetes du niveau specifie. Le reste 
du texte dans le paragraphe est traite comme etant la description de l'en-tete. Elle 
sont identiques aux en-tetes de section et de sous-section . SH et . SS dans man{7) ou 
aux balises <hl>. . .</hl> et <h2>. . .</h2> en HTML. En fait, ces traducteurs conver- 
tissent ces directives exactement comme cela. 

=cut 

La directive =cut indique la fin du mode pod. (II peut y avoir encore du pod plus 
loin dans le document mais, si c'est le cas, il sera introduit par une autre directive 
pod.) 

=pod 

La directive =pod ne fait rien d'autre que dire au compilateur d'arreter d'analyser le 
code jusqu'au prochain =cut. Elle est utile pour ajouter un autre paragraphe au 
document si vous melangez beaucoup du code et du pod. 

=over NOMBRE 
=item SYMBOL E 
=back 

La directive =over commence un paragraphe specifiquement pour la generation 
d'une liste utilisant la directive =item. A la fin de votre liste, utilisez =back pour la 
terminer. Le NOMBRE, s'il est fourni, indique au formateur de combien d'espaces 
indenter. Certains formateurs ne sont pas assez riches pour respecter l'indication, 
alors que d'autres le sont trop pour la respecter, tant il est difficile, lorsqu'on tra- 
vaille avec des fontes proportionnelles, d'aligner le texte simplement en comptant 
les espaces. (Toutefois, on presume en general qu'avec quatre espaces il y a assez de 
place pour une puce ou un numero.) 

Le veritable type de la liste est indique par le SYMBOLE sur chaque element. Voici 
une liste a puces : 
=over 4 

=item * 

Armure de mithril 
=item * 

Manteau elfique 



=back 
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Une liste numerotee : 
=over 4 

=item l. 

Premierement, dites "ami". 
=item 2. 

Deuxiemement, entrez dans la Moria. 
=back 

Une liste de definitions : 
=over 4 

=item armureQ 

Description de la fonction armureQ 
=item chant() 

Description de la fonction chantQ 
Vous pouvez imbriquer des listes de types identiques ou differents mais il faut 
appliquer certaines regies de base : n'utilisez pas =item en dehors d'un bloc 
=over/=back ; utilisez au moins un =item a l'interieur d'un bloc =over/=back ; et 
peut-etre le plus important, conservez une coherence dans le type des items dans 
une liste donnee. Utilisez soit =item * avec chaque element pour produire une liste 
a puces, soit =item 1., =item 2., et ainsi de suite pour produire une liste numero- 
tee, soit utilisez =item true, =item machin, et ainsi de suite pour produire une liste 
de definitions. Si vous commencez avec des puces ou des numeros, gardez-les, puis- 
que les formateurs sont autorises a utiliser le type du premier =item pour decider 
de comment formater la liste. 

Comme pour tout ce qui concerne pod, le resultat n'est pas meilleur que le traduc- 
teur. Certains traducteurs accordent de Fattention aux nombres particuliers (ou 
aux lettres, ou aux chiffres remains) qui suivent l'=item et d'autres non. Le traduc- 
teur pod2html actuel, par exemple, est quelque peu cavalier : il vide entierement la 
sequence d'indicateurs sans les regarder pour en deduire quelle sequence vous utili- 
sez, puis il enveloppe la liste complete a l'interieur de balises <ol> et </ol> pour 
que le navigateur puisse afficher une liste ordonnee en HTML. Ce ne doit pas etre 
interprets comme une fonctionnalite, cela pourra eventuellement etre corrige. 

=for TRADUCTEUR 
=begin TRADUCTEUR 
=end TRADUCTEUR 

=for, =begin et =end vous permettent d'inclure des paragraphes speciaux a passer 
inchanges aux formateurs, mais seulement a des formateurs particuliers. Les forma- 
teurs reconnaissant leur propre nom ou des alias pour leur nom, dans TRADUCTEUR 
font attention a ces directives ; tous les autres les ignorent completement. La direc- 
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tive =f or specifie que le reste de ce paragraphe n'est prevu que pour (for, en anglais) 
un traducteur particulier. 
=for html 

<p> Voici un paragraphe en <small>HTML</small> <flash>brut</flash> </p> 
Les directives appariees =begin et =end fonctionnent de maniere identique a =for 
mais, au lieu de n'accepter qu'un seul paragraphe, dies traitent tout le texte com- 
pris entre le =begin et le =end correspondant comme etant destine a un traducteur 
particulier. Quelques exemples : 

=begin html 

<br>Figure l.<img src="figure.png"xbr> 
=end html 
=begin text 



| true | 
i machin 



AAAA p^gUre 1 AAAA 

=end text 

Les valeurs de TRADUCTEUR couramment acceptees par les formateurs comprennent 
roff, man, troff, nroff, tbl, eqn, latex, tex, html et text. Certains formateurs 
accepteront certains d'entre eux comme synonymes. Aucun traducteur n'accepte 
comment — il s'agit juste du mot habituel pour quelque chose devant etre ignore 
par tout le monde. N'importe quel mot non reconnu pourrait jouer le meme role. 
En ecrivant ce livre, nous avons souvent laisse des remarques pour nous memes 
sous la directive =f or later (pour plus tard). 

Remarquez que =begin et =end s'emboitent mais seulement dans le sens oil la paire 
la plus a l'exterieur fait que tout ce qui se trouve au milieu est traite comme n' etant 
pas du pod, meme s'il y a la-dedans d'autres directives =mot. C'est-a dire que des 
qu'un traducteur voit =begin true, soit il ignorera, soit il traitera tout jusqu'au =end 
true correspondant. 

Sequences pod 

Le troisieme type de paragraphe est simplement du texte au kilometre. C'est a dire que 
si un paragraphe ne commence ni par un espace, ni par un signe egal, il est pris comme 
un paragraphe a plat : du texte ordinaire tape avec aussi peu de decorations que possible. 
Les sauts de ligne sont traites comme des espaces. C'est en grande partie au traducteur 
de le rendre agreable car les programmeurs ont des choses plus importantes a faire. On 
presume que les traducteurs appliqueront certaines heuristiques courantes — voir la 
section Traducteurs et modules pod plus loin dans ce chapitre. 

Vous pouvez toutefois faire certaines choses explicitement. A l'interieur des paragra- 
phes ordinaires ou des directives d'en-tetes ou d'items (mais pas dans les paragraphes 
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« tels quels »), vous pouvez utiliser des sequences speciales pour ajuster le formatage. 
Ces sequences commencent toujours par une seule lettre majuscule suivie par un signe 
inferieur et elles se prolongent jusqu'au signe superieur correspondant (qui n'est pas for- 
cement le suivant). Les sequences peuvent contenir d'autres sequences. 

Voici les sequences definies par pod : 

l<texte> 

Texte en italique, utilise pour mettre en relief, pour les titres de livres, les noms de 
bateaux et les references de pages de manuel comme « per!pod(l) ». 

B<texte> 

Texte en gras, utilise presqu'exclusivement pour les options de la ligne de com- 
mande et parfois pour les noms de programmes. 

C<texte> 

Code litteral, probablement dans une fonte de largeur fixe, comme du Courrier. Ce 
n'est pas necessaire pour les items dont le traducteur devrait etre capable d'en 
deduire qu'il s'agit de code mais vous devriez mettre cette sequence de toute facon. 

S<texte> 

Texte avec des espaces insecables. Entoure souvent d'autres sequences. 
l<nom> 

Une reference croisee (un lien) vers un nom : 
L<nom> 

Page de manuel. 
L<nom/ident> 

Article dans une page de manuel. 
L<nom /"sec"> 

Section dans une autre page de manuel. 
L<"sec"> 

Section dans cette page de manuel (les guillemets sont optionnels). 
L</"sec"> 
Idem. 

Les cinq sequences suivantes sont les memes que celles ci-dessus, mais la sortie sera 
seulement texte, en cachant l'information sur le lien, comme en HTML : 

L<texte \nom> 
L<texte \nom/ident> 
L<texte \nom/"sec"> 
L<texte |"sec"> 
L<texte |/"sec"> 

Le texte ne peut pas contenir les caracteres / et | et il ne devrait contenir < ou > 
que s'il s'agit d'une paire. 
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f<chemin> 

Utilise pour les noms de fichiers. Ceci donne traditionnellement la meme presenta- 
tion que I. 

X<entree> 

Une entree d'index quelconque. Comme toujours, c'est au traducteur de decider 
quoi faire. La specification de pod n'impose rien a ce sujet. 

E<seq_echappement> 

Un caractere nomme, comme les sequences d'echappement en HTML : 

E<lt> 

Un < litteral (optionnel, sauf a l'interieur d'autres sequences et lorsqu'il est pre- 
cede d'une lettre en majuscule). 

E<gt> 

Un > litteral (optionnel, sauf a l'interieur d'autres sequences). 
E<sol> 

Un / litteral (necessaire seulement dans Lo). 
E<verbar> 

Un | litteral (necessaire seulement dans Lo). 
E<A/MV> 

Le caractere numero NNN, probablement en ISO-8859-1, mais peut-etre en Uni- 
code. Cela ne devrait rien changer, dans l'abstrait... 

£<entite> 

Une entite HTML non numerique, comme E<Agrave>. 

Zo 

Un caractere de taille nulle. C'est sympathique pour prefixer des sequences qui 
pourrait rendre quelque chose confus. Par exemple, si vous aviez une ligne en prose 
ordinaire que devait commence par un signe egal, vous devriez l'ecrire ainsi : 
Zo=vous voyez ? 

ou pour quelque chose contenant un « From », pour que le logiciel de mail ne 
mette pas un > devant : 

ZoFrom veut dire "de la part de" en anglais... 
La plupart du temps, vous n'aurez besoin que d'un seul ensemble de signes supe- 
rieur/inferieur pour delimiter l'une de ces sequence pod. Cependant, vous voudrez 
parfois mettre un < ou un > a l'interieur d'une sequence. (C'est particulierement 
courant lorsqu'on utilise une sequence Co pour donner une fonte de largeur fixe a 
un extrait de code.) Comme toujours en Perl, il y a plus d'une maniere de faire. 
Une methode est de simplement representer les signes inferieur/superieur avec une 
sequence E : 

C<$a E<lt>=E<gt> $b> 
Ce qui donne « $a <=> $b ». 

Une methode plus lisible et peut-etre plus « a plat », est d'utiliser un autre ensem- 
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ble de delimiteurs qui ne necessite pas que les signes inferieur/superieur soient pro- 
teges. Des doubles chevrons (C<< true >>) peuvent etre employes, pourvu qu'il y ait 
un espace suivant immediatement le delimiteur ouvrant et precedent immediate- 
ment le delimiteur fermant. Par exemple, ce qui suit fonctionnera : 
C« $a <=> $b >> 

Vous pouvez utiliser autant de chevrons que vous desirez pour autant que vous en 
avez le meme nombre des deux cotes et que vous vous etes assure qu'un espace 
suive immediatement le dernier < du cote gauche et qu'un espace precede imme- 
diatement le premier > du cote droit. Ainsi, ce qui suit fonctionnera egalement : 

C«< $a <=> $b >» 

C«<< $a <=> $b >»> 
Tous ces exemples finissent par donner $a <=> $b dans une fonte de largeur fixe. 
L'espace supplementaire a Finterieur de chaque extremite disparait, vous devriez 
done laisser un espace a Fexterieur si vous en voulez un. De meme, les deux caracte- 
res espaces supplementaires a Finterieur ne se chevauchent pas, done, si la premiere 
chose citee est >>, ce n'est pas pris en tant que delimiteur fermant : 

L'operateur C<< >> >> de decalage vers la droite. 
Ce qui donne « L'operateur >> de decalage vers la droite ». 

Remarquez que les sequences pod s'imbriquent bien. Cela signifie que vous pouvez 
ecrire « La IxSanta MarE<iacute>a> a pris le large depuis longtemps » pour 
produire « La Santa Maria a pris le large depuis longtemps » ou « Ektouch> S<B<- 
t> I<time> > I<fichier> » pour produire « touch -t timefichier », et vous atten- 
dre a ce que ca marche correctement. 

Traducteurs et modules pod 

Perl est livre avec plusieurs traducteurs de pod qui convertissent les documents en pod 
(ou le pod inclus dans d'autres types de documents) vers divers formats. Tous devraient 
travailler purement sur 8 bits. 

pod2text 

Convertit du pod en texte. Normalement, ce texte sera en ASCII sur 7 bits mais il 
sera sur 8 bits s'il a recu une entree sur 8 bits, ou specifiquement de l'ISO-8859-1 
(ou de FUnicode) si vous utilisez des sequence telles que LE<uacute>thien pour 
Luthien ou EE<auml>rendil pour Edrendil. 

Si vous avez un fichier contenant du pod, la maniere la plus facile (mais peut-etre 
pas la plus jolie) de ne visualiser que le pod formate serait : 

% pod2text Fichier. pm | more 
Mais, encore une fois, le pod est suppose etre lisible par un humain sans formatage. 

pod2man 

Convertit du pod vers le format des pages de manuel d'Unix, qui convient pour 
etre visualise via nroff (1) ou pour creer des copies composees via troff (1). Par exem- 
ple : 

% pod2man Fichier. pm | nroff -man | more 

ou 
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% pod2man Fichier.pm | troff -man -Tps -t > page_temp.ps 
% ghostview page_temp.ps 

et pour imprimer : 

% lpr -Ppostscript page_temp.ps 

pod2html 

Convertit le pod en HTML pour aller avec votre navigateur prefere : 
% pod2html Fichier.pm > page_temp.html 
% lynx page_temp.html 

% netscape -remote "openURL(file: f pwd f /page_temp.html)" 

Le dernier exemple est une astuce de Netscape qui ne fonctionne que si vous avez 
deja un navigateur de lance quelque part pour dire a cette incarnation de charger la 
page. Sinon, appelez-le exactement comme vous Favez fait pour lynx. 

pod2latex 

Convertit du pod en LATEX. 

Des traducteurs supplementaires pour d'autres formats sont disponibles sur CPAN. 

Les traducteurs font preuve de comportements par defaut differents selon le format de 
sortie. Par exemple, si votre pod contient un paragraphe en prose disant : 

II s'agit ici d'une $variable 

alors podlhtml changera ca en : 

II s'agit ici d'une <STRONG>$variable</STRONG> 

alors que pod2text le laissera sans decoration, puisque le dollar devrait suffire pour que 
cela soit lisible. 

Vous devriez ecrire votre pod en restant le plus proche possible du texte « a plat », en 
vous passant le plus possible de balises explicites. C'est a chaque traducteur de decider 
comment creer des signes de protection apparies, comment remplir et ajuster le texte, 
comment trouver une fonte plus petite pour les mots entierement en majuscules, etc. 
Puisqu'ils ont ete ecrits pour traiter la documentation en Perl, la plupart des traduc- 
teurs 1 devraient egalement reconnaitre des elements sans decoration comme ceux-ci et 
les presenter de maniere appropriee : 

• HANDLE_FICHIER 

• $scalaire 

• ^tableau 

• fonctionQ 

• page_man(3r) 
quelquun@quelquepart.com 
http://truc.com/ 

Perl apporte egalement plusieurs modules standard pour analyser et convertir du pod, 



1. Si vous concevez un traducteur de pod generique, et non pour du code Perl, vos criteres peu- 
vent differer. 
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comprenant Pod : : Checker (et l'utilitaire associe podchecker) pour verifier la syntaxe des 
documents pod, Pod : : Find pour trouver des documents pod dans les arborescences de 
repertoires et Pod : : Parser pour creer vos propres utilitaires pod. 

Remarquez que les traducteurs de pod devraient seulement regarder les paragraphes 
commencant par une directive pod (cela facilite l'analyse), puisqu'en fait le compilateur 
sait rechercher les sequences d'echappement pod mime au milieu d'un paragraphe. 
Cela signifie que le secret suivant sera ignore a la fois par le compilateur et par les tra- 
ducteurs. 

$a=3; 
=secret 

warn "Ni du POD, ni du CODE !?" 

=cut back 

print "recu $a\n"; 

Vous ne devriez probablement pas vous reposer sur le fait que le warn restera a jamais 
sorti du pod. Les traducteurs de pod ne sont pas tous sages a cet egard et le compilateur 
pourrait devenir moins selectif un jour ou l'autre. 

Ecrire vos propres outils pod 

Pod a ete concu tout d'abord et surtout pour etre facile a ecrire. Un corollaire de la sim- 
plicity de pod est qu'elle permet d'ecrire soi-meme des outils simples pour traiter du 
pod. Si vous recherchez des directives pod, vous n'avez qu'a positionner le separateur 
d'enregistrements en entree en mode paragraphe (peut-etre avec l'option -00) et n'ac- 
corder de l'attention qu'a ce qui ressemble a du pod. 

Voici par exemple un simple programme afficheur de plan en pod : 

#!/usr/bin/perl -lOOn 
# planpod - affiche le plan en pod 
next unless / A =head/; 
s/ A =head(\d)\s+/ " x ($1 * 4 - 4)/e; 
print "\n"; 

Si vous le lancez sur le present chapitre de ce livre, vous obtiendrez quelque chose com- 
me cela : 

Plain Old Documentation 
Pod en quelques mots 

Paragraphes « tels quels » 

Directives pod 

Sequences pod 
Traducteurs et modules pod 
Ecrire vos propres outils pod 
Pieges du pod 

Documenter vos programmes perl 

Cet afficheur de plan en pod n'a pas vraiment fait attention au fait que le bloc pod etait 
valide ou non. Puisque ce qui est en pod et ce qui ne Test pas peuvent s'entremeler dans 
le meme fichier, cela n'a pas toujours de sens de lancer des outils generiques pour re- 
chercher et analyser le fichier complet. Mais ce n'est pas un probleme, etant donne qu'il 
est si facile d'ecrire des outils pour le pod. Voici un outil qui est attentif aux differences 
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entre le pod et ce qui n'est pas du pod, puis n'affiche que le pod : 
#!/usr/bin/perl -00 

# catpod - n'affiche que ce qui est en pod 
while (<>) { 

if (!$enpod) { $enpod = / A =/; } 
if ($enpod) { $enpod = !/=cut/; print; } 
} continue { 

if (eof) { close ARGV; $enpod = " ; } 

} 

Vous pourriez utiliser ce programme sur un autre programme ou un module en Perl, 
puis mettre un pipe sur la sortie vers un autre outil. Par exemple, si vous posseder le 
programme wc(l) 2 pour compter le nombre de lignes, de mots et de caracteres, vous 
pourriez l'approvisionner avec la sortie de catpod pour qu'il ne considere dans son 
comptage que le pod : 

% catpod MonModule.pm | wc 

II existe beaucoup d'endroits ou le pod vous permet d'ecrire des outils rudimentaires de 
facon simplissime en utilisant directement du Perl brut. Maintenant que vous avez cat- 
pod a utiliser comme composant, voici un autre outil pour ne montrer que le code in- 
dente : 

#!/usr/bin/perl -nOO 

# podlit - affiche les blocs litteraux indentes 

# a partir de pod en entree 
print if / A \s/; 

Que pourriez-vous faire avec ca ? Et bien, vous pourriez premierement vouloir verifier 
le code dans le document avec perl -wc. Ou peut-etre voudriez-vous une fonctionnalite 
de grep(l) 3 qui ne regarde que les exemples de code : 

% catpod MonModule.pm | podlit | grep nom_fonc 

Cette philosophie, selon laquelle les outils et les filtres sont des parties interchangeables 
(et testables unitairement), est une approche tout bonnement simple et puissante pour 
concevoir des composants logiciels reutilisables. C'est une forme de paresse de ne cons- 
truire qu'une solution minimale pour accomplir le travail aujourd'hui — du moins, 
pour certains types de travaux. 

Cependant, pour d'autres taches, ceci peut mime s'averer contre-productif. Parfois, il y 
a plus de travail a ecrire un outil a partir de rien et parfois moins. Pour ceux que nous 
vous avons montres precedemment, les prouesses naturelles de Perl en ce qui concerne 
le traitement du texte sont tout indiquees pour appliquer « la force brute ». Mais tout 
ne fonctionne pas de cette facon. En jouant avec le pod, vous pourriez remarquer que 
bien que ses directives soient simples a analyser, ces sequences peuvent s'averer plus ris- 
quees. Bien que des traducteurs, hum, pas tres corrects, ne s'adaptent pas a ceci, les se- 
quences peuvent s'imbriquer dans d'autres sequences et peuvent avoir des delimiteurs 
de taille variable. 



2. Et si ce n'est pas le cas, allez cherchez la version des Perl Power Tools dans le repertoire scripts 
de CPAN. 

3. Et si vous ne possedez pas grep, voir la precedente note de bas de page. 
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Au lieu de vous mettre a coder vous-meme ce code d'analyse, les paresseux chercheront 
une autre solution. Le module standard Pod : : Parser remplit ce contrat. II est tout par- 
ticulierement utile pour les taches difficiles, comme celles qui necessitent une reelle 
analyse des morceaux internes des paragraphes, une conversion vers d'autres formats de 
sortie, et ainsi de suite. II est plus facile d'utiliser le module pour les cas compliques car 
la quantite de code a laquelle vous aboutirez est plus petite. C'est egalement mieux car 
l'analyse epineuse est deja realisee pour vous. II s'agit tout a fait du meme principe que 
l'emploi de catpod dans une chaine de pipes. 

Le module Pod: : Parser adopte une approche interessante dans son travail. C'est un 
module oriente objet d'une facture differente de la plupart de ceux que vous avez vus 
dans ce livre. Son objectif premier n'est pas tant de fournir des objets a manipuler direc- 
tement que d'apporter une classe de base a partir de laquelle d'autres classes peuvent 
etre construites. 

Vous creez votre propre classe et heritez de Pod: : Parser. Puis vous declarez des sous- 
programmes servant de methodes de rappel (callbacks) que l'analyseur de votre classe 
parente invoquera. II s'agit d'une facon de programmer differente des programmes pro- 
ceduraux donnes precedemment. Dans un sens, il s'agit plus d'un style de programma- 
tion declaratif car, pour accomplir le travail, vous enregistrez simplement des fonctions 
et laissez d'autres entites les invoquer pour vous. La logique ennuyeuse du programme 
est geree ailleurs. Vous ne faites que donner des morceaux « plug-and-play ». 

Voici une reecriture du programme original catpod donne auparavant mais, cette fois-ci, 
elle utilise le module Pod : : Parser pour creer votre propre sous-classe : 

#!/usr/bin/perl 

# catpod2j classe et programme 

package catpod_analyseur; 
use Pod: : Parser; 
@ISA = qw(Pod: : Parser); 
sub command { 

my ($analyseur, $commande, $paragraphe, $num_ligne) = 

my $hf_sortie = $analyseur->output_handle(); 

$paragraphe .= "\n" unless substr($paragraphe, -l) eq "\n"; 

$paragraphe .= "\n" unless substr($paragraphe, -2) eq "\n\n"; 

print $hf_sortie "=$commande $paragraphe"; 



} 



sub 



verbatim { 

my ($analyseur, $paragraphe, $num_ligne) = (5)_; 
my $hf_sortie = $analyseur->output_handle(); 
print $hf_sortie $paragraphe; 



} 



sub 



textblock { 

my ($analyseur, $paragraphe, $num_ligne) = |9_; 
my $hf_sortie = $analyseur->output_handle(); 
print $hf_sortie $paragraphe; 



} 
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sub interiorsequence { 

my ($analyseur, $commande_seq, $argument_seq) = @_; 
return "$commande_seq<$argument_seq>"; 

} 

if (! caller) { 
package main; 

my $analyseur = catpod_analyseur->new(); 

unshift @ARGV, unless @ARGV; 

for (@ARGV) { $analyseur->parse_from_file($_); } 

} 

i; 

END 

=headl NAME 

documentation decrivant le nouveau programme catpod, ici 

Comme vous le voyez, c'est un peu plus long et plus complique. C'est egalement plus 
evolutif car tout ce que vous avez a faire est de brancher vos propres methodes lorsque 
vous voulez que votre sous-classe agisse differemment que sa classe de base. 

Le dernier morceau a la fin, oil il est ecrit ! caller, verifie si le fichier est utilise en tant 
que module ou en tant que programme. S'il est employe comme programme, il n'y aura 
alors pas d'appelant (caller en anglais). II lancera done son propre analyseur (en utili- 
sant la methode new dont il a herite) sur les arguments de la ligne de commande. Si 
aucun nom de fichier n'a ete passe, il prend l'entree standard, tout comme le faisait la 
version precedente. 

A la suite du code du module, il y a un marqueur END , une ligne vide sans espace, 

puis la propre documentation en pod du programme/module. II s'agit d'un exemple 
d'un fichier qui est a la fois un programme et un module et sa propre documentation. 
II est probablement plusieurs autres choses egalement. 

Pieges du pod 

Pod est assez direct a apprendre et a ecrire mais il est toujours possible de rater quelques 
petites choses : 

II est vraiment facile d'oublier le signe superieur final. 

• Il est vraiment facile d'oublier la directive =back finale. 

• II est facile de mettre accidentellement une ligne vide au milieux d'une longue 
directive =f or comment. Songez a utiliser =begin/=end a la place. 

• Si vous faites une faute de frappe sur Fune des deux balises d'une paire 
=begin/=end, cela avalera tout le reste de votre fichier (en ce qui concerne le pod). 
Songez a utiliser =f or a la place. 

• Les traducteurs de pod exigent que les paragraphes soient separes par des lignes 
completement vides ; e'est-a-dire, par au moins deux caracteres de saut de ligne con- 
secutifs (\n). Si vous avez une ligne avec des espaces ou des tabulations, elle ne sera 
pas prise comme une ligne blanche. Ceci peut causer le traitement de deux paragra- 
phes ou plus comme s'il n'y en avait qu'un seul. 
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• La signification d'un « lien » n'est pas definie par pod et c'est a chaque traducteur 
de decider quoi en faire. (Si vous commencez a penser que la plupart des decisions 
ont ete reportees sur les traducteurs et pas dans pod, vous avez raison.) Les traduc- 
teurs ajouteront souvent des mots autour d'un lien Lo, ainsi, « L<truc(l)>» 
deviendra « la page de manuel truc{\) », par exemple. Vous ne devriez done pas 
ecrire des choses comme « la page de manuel L<truc> » si vous voulez que le 
document traduit soit raisonnablement lisible : cela aboutirait a « la page de 
manuel la page de manuel truc{\) ». 

Si vous avez besoin d'un controle total sur le texte utilise dans un lien, utilisez plu- 
tot la forme L<montre ce texte |truc>. 

Le programme standard podchecker verifie la syntaxe pod pour trouver les erreurs et les 
avertissements. Par exemple, il recherche les sequences pod inconnues et les lignes blan- 
ches trompeuses contenant des espaces. II est toujours recommande de passer votre do- 
cument a travers differents traducteurs de pod et de corriger les resultats. Certains des 
problemes que vous trouverez peuvent etre des idiosyncrasies des traducteurs particu- 
liers, ce sur quoi vous voudrez ou non travailler. 

Et, comme toujours, tout est sujet a modification selon les caprices d'un hacker quelconque. 

Documenter vos programmes Perl 

Nous esperons que vous documentez votre code, que vous soyez ou non un hacker quel- 
conque. Si c'est le cas, vous pouvez souhaiter inclure les sections suivantes dans votre 
pod : 

=headl NOM 

Le nom de votre programme ou de votre module. 
=headl SYNOPSIS 

Une description d'une ligne sur ce que fait (soi-disant) votre programme ou votre 
module. 

=headl DESCRIPTION 

La masse de votre documentation. (Masse est le terme approprie dans ce contexte.) 
=headl AUTEUR 

Qui vous etes. (Ou un pseudonyme, si vous avez honte de votre programme.) 
=headl BOCUES 

Ce que vous avez mal fait (et pourquoi ce n'etait pas vraiment votre faute). 
=headl VOIR AUSSI 

Oil les gens peuvent trouver des informations en rapport (pour qu'ils puissent tra- 
vailler sur vos bogues). 

=headl COPYRIGHT 

Les instructions legales. Si vous voulez revendiquer un copyright explicite, vous 
devriez dire quelque chose comme : 

Copyright 2013, Randy Waterhouse. Tous droits reserves? 
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Beaucoup de modules ajoutent egalement : 

Ce programme est un logiciel libre. Vous pouvez le copier ou le 
redistribuer sous les memes termes que Perl lui-meme. 

Un avertissement : si vous etes sur le point de mettre votre pod a la fin du fichier et que 

vous utilisez les tokens END ou DATA , assurez-vous de mettre une ligne vide 

avant la premiere directive pod : 

END 

=headl NOM 

Moderne - De suis vraiment un modele d'un module essentiel moderne 

Sans la ligne vide avant le =headl, les traducteurs de pod ignoreront le debut de votre 
documentation (vaste, precise, cultivee). 
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Ce livre fait partie de la culture Perl, nous ne pouvons done pas esperer mettre ici tout 
ce que nous connaissons a propos de la culture Perl. Nous pouvons seulement attiser 
votre appetit avec un peu d'histoire et un peu d'art — certains diraient « de Fart 
mineur ». Pour une dose beaucoup plus grosse de culture Perl, voir www.perl.org et 
www.perl.com. (Larry garde des copies de tous ses delires (officiels) a 
www.wall.org/~larry.) Ou acoquinez-vous a d'autres programmeurs Perl. Nous ne pou- 
vons pas vous dire quel genre de personnes ils seront — le seul trait de caractere que les 
programmeurs Perl ont en commun est qu'ils sont pathologiquement serviables. 

Vhistoire en pratique 

Pour comprendre pourquoi Perl est ainsi defini (ou indefini), il faut d'abord compren- 
dre la raison meme pour laquelle Perl existe. Sortons done le grimoire poussiereux... 

En 1986, Larry etait un programmeur systeme sur un projet de reseaux a grande echelle 
et a multiples niveaux de securite. II s'occupait d'une installation composee de trois Vax 
et de trois Sun sur la Cote Ouest, connected par une ligne serie chiffree a 1200 bauds a 
une configuration similaire sur la Cote Est. Comme son travail consistait surtout en du 
support (il n'etait pas programmeur sur le projet, seulement le gourou systeme), il put 
exploiter ses trois vertus (paresse, impatience et orgueil) pour developper et ameliorer 
toutes sortes d'outils interessants — comme rn, patch et warp. 1 



1. C'est a peu pres a ce moment que Larry revendiqua l'expression « feeping creaturism » 
(N.d.T. : jeu de mot delibere avec « creeping featurism », ajouter des fonctionnalites rampantes, 
signifiant que le systeme ou le programme en question est devenu une creature difforme a cause 
des bidouilles qu'on lui a successivement ajoutees). Ceci dans une tentative desesperee de justi- 
fier, sur la base d'une necessite biologique, l'habitude d'ajouter « rien qu'une derniere 
fonctionnalite ». Apres tout, si la vie est simplement trop compliquee, pourquoi pas les 
programmes ? Surtout les programmes comme rn qui devraient vraiment etre traites comme des 
projets avances d'Intelligence Artificielle afin qu'ils puissent lire les news pour vous. Evidem- 
ment, certains trouvent le programme patch deja trop intelligent. 
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Un jour, alors que Larry finissait de decouper rn en petits morceaux, le laissant eparpille 
sur le sol de son repertoire, le Grand Patron vint a lui et dit : « Larry, il nous faut un 
systeme de gestion de configurations et de controle pour les six Vax et les six Sun. Dans 
un mois. Execution ! » 

Larry, qui n'a jamais ete un faineant, se demanda quel etait le meilleur moyen d'obtenir 
un systeme de gestion de configurations transcontinental, sans devoir partir de zero, qui 
permettrait de visualiser les rapports d'incidents sur les deux cotes, avec validation et 
controle. La reponse tenait en un mot : B-news. 2 

Larry commenca par installer les news sur ces machines et ajouta deux commandes de 
controle : une commande « append » pour enrichir un article existant et une comman- 
de « synchronize » pour que les numeros d'articles restent les memes sur les deux cotes. 
La gestion du controle passerait par RCS (Revision Control System) et les validations et 
les soumissions se feraient par les news et rn. Jusqu'ici, tout allait bien. 

Puis, le Grand Patron lui demanda de fournir des rapports. Les news etaient maintenues 
dans des fichiers separes sur une machine maitre, avec un grand nombre de references 
croisees entre les fichiers. La premiere pensee de Larry fut : « Utilisons aw k. » Malheu- 
reusement, le awk d'alors ne savait pas gerer Fouverture et la fermeture de plusieurs fi- 
chiers en fonction des informations de ces fichiers. Larry ne voulait pas programmer un 
outil specifique. C'est ainsi qu'un nouveau langage naquit. 

A l'origine, il ne s'appelait pas Perl. Larry envisagea un certain nombre de noms avec 
ses collegues et son entourage (Dan Faigin, qui ecrivit cette histoire et Mark Biggar, son 
beau-frere, qui l'assista enormement lors de la conception initiale). Larry considera et 
rejeta en fait tous les mots de 3 ou 4 lettres du dictionnaire. L'un des premiers avait ete 
« Gloria », inspire de sa chere et tendre (et epouse). II se dit rapidement que cela provo- 
querait trop de confusions d'ordre domestique. 

Le nom devint alors « Pearl », qui muta en notre « Perl » actuel, en partie parce que 
Larry trouva une reference a un autre langage nomme « PEARL » mais surtout parce 
qu'il est trop paresseux pour taper cinq lettres d'affilee a chaque fois. Evidemment, afin 
que Perl puisse etre utilise comme l'un de ces mots de quatre lettres chers aux anglopho- 
nes. (Notez cependant les vestiges du nom initial dans le developpement de 
Facronyme : « Practical Extraction And Report Language »). 

Le Perl des origines avait beaucoup moins de fonctionnalites que celui d'aujourd'hui. 
La recherche de correspondances et les handles de fichiers etaient la, les scalaires aussi, 
de meme que les formats, mais il ne comportait que tres peu de fonctions, pas de ta- 
bleaux associatifs et juste une implementation restreinte des expressions regulieres, em- 
pruntee a rn. Le manuel ne contenait que 15 pages. Mais Perl etait plus rapide que sed 
et awk et commenca a etre utilise pour d'autres applications du projet. 

Mais Larry etait demande par ailleurs. Un autre Grand Patron arriva un jour et dit : 
« Larry, il faut assister la R&D » . Et Larry fut d'accord. II prit Perl avec lui et decouvrit 
qu'il se transformait en un bon outil d'administration systeme. II emprunta a Henry 
Spencer son superbe paquetage d'expressions regulieres et le charcuta en quelque chose 
auquel Henry prefererait ne pas penser a table. Puis Larry ajouta la plupart des fonc- 
tionnalites qui lui semblaient bonnes et quelques autres que d'autres personnes desi- 



2. C'est-a-dire la seconde implementation du logiciel de transport de Usenet. 
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raient. II le diffusa sur le reseau. 3 Le reste, comme on dit, appartient a l'histoire. 4 

L'histoire s'est deroulee comme ceci : Perl 1.0 sort le 18 decembre 1987 ; certains pren- 
nent toujours au serieux l'anniversaire de Perl. Perl 2.0 suit en juin 1988 et Randal 
Schwartz cree la signature legendaire « Just Another Perl Hacker » (juste un autre bi- 
douilleur Perl). En 1989, Tom Christiansen presente le premier tutoriel public au Use- 
nix de Baltimore. Avec Perl 3.0 en octobre 1989, le langage sort et distribue pour la 
premiere fois dans les termes de la Licence Publique Generale de GNU. 

En mars 1990, Larry ecrit le premier poeme en Perl (voir la section suivante). Puis lui 
et Randal ecrivent la premiere edition de ce livre, le « Pink Camel » (le chameau rose 
ou fushia) ; il est publie en debut d'annee 1991. Perl 4.0 sort en meme temps ; il com- 
prend la Licence Artistique ainsi que la LPG. 

L'inauguration du tres attendu Perl 5 se deroule en octobre 1994. C'est une reecriture 
complete de Perl, comprenant des objets et des modules. L'avenement de Perl 5 fait 
meme la couverture du journal The Economist. En 1995, CPAN est officiellement presen- 
te a la communaute Perl. Jon Orwant commence a publier The Perl Journal en 1996. 
Apres une longue gestation, la seconde edition de ce livre, le « Blue Camel » (le cha- 
meau bleu) parait cet automne. La premiere conference Perl d'O'Reilly (TPC) se derou- 
le a San Jose, en Californie, durant l'ete 1997. Des evenements marquants arrivent 
maintenant presque quotidiennement, done, pour la suite de l'histoire, regardez la Perl 
Timeline sur CPAST, le Comprehensive Perl Arcana Society Tapestry (N.d.T : la ligne du 
temps sur la tapisserie de la societe des arcanes detaillees de Perl) sur history.perl.org. 

Poesie en Perl 

La contrefacon ci-contre apparut sur Usenet le l er avril 1990. Elle est presentee sans 
commentaires, essentiellement afin de montrer quel degre d'abjection peuvent attein- 
dre les metaphores d'un langage de programmation typique. Larry est particulierement 
soulage que « Black Perl », ecrit a Forigine pour Perl 3, ne compile plus sous Perl 5. 

Le, euh, corpus de Larry a ete heureusement supplante par la Poetesse Perl regnante, 
Sharon Hopkins. Elle a ecrit un certain nombre de poemes Perl, ainsi qu'un article sur 
la poesie en Perl, qu'elle a presente a la Conference Technique Usenix de l'hiver 1992, 
intitule « Camel and Needles: Computer Poetry Meets the Perl Programming 
Language » (Le chameau et les aiguilles : quand la poesie informatique rencontre le lan- 
gage de programmation Perl). (L'article est disponible sous misc/poetry.ps sur CPAN.) 
Non contente d'etre la plus prolifique des poetesses Perl, Sharon est egalement la plus 
largement publiee, le poeme suivant etant sorti dans YEconomist et le Guardian : 



3. Ce qui est encore plus extraordinaire, c'est qu'il continua a le diffuser alors qu'il etait embau- 
che chez Jet Propulsion Lab, puis NetLabs, puis Seagate. Maintenant, d'autres personnes font la 
plupart du vrai boulot et Larry pretend travailler pour O'Reilly & Associates (une petite societe 
qui publie des opuscules sur les ordinateurs et autres balivernes). 

4. Et voici, pour ainsi dire, un addendum a l'histoire. Aux debuts de Perl, rn venait d'etre mis 
en pieces avant une reecriture complete. Depuis qu'il a commence a travailler sur Perl, Larry n'a 
plus touche a rn. II reste en pieces detachees. Parfois, Larry menace de reecrire rn en Perl mais 
jamais serieusement. 



614 



Chapitre 27 — Culture Perl 



#!/usr/bin/perl 
APPEAL: 

listen (please, please); 

open yourself, wide; 

join (you, me), 
connect (us, together), 

tell me. 

do something if distressed; 

(Sdawn, dance; 
(Sevening, sing; 

read (books, $poems, stories) until peaceful; 
study if able; 

write me if-you-please; 

sort your feelings, reset goals, seek (friends, family, anyone); 

do*not*die (like this) 
if sin abounds; 

keys (hidden), open (locks, doors), tell secrets; 
do not, I-beg-you, close them, yet. 

accept (yourself, changes), 
bind (grief, despair); 

require truth, goodness if-you-will, each moment; 

select (always), length(of-days) 

# listen (a perl poem) 

# Sharon Hopkins 

# rev. Dune 19, 1995 
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Poesie en Perl 

Article 970 of comp.lang.perl: 

Path: jpl-devvax!jpl-dexxav!lwall 

From: lwall@jpl-dexxav.JPL.NASA.GOV (Larry Wall) 

Newsgroups: news.groups,rec.arts.poems,comp.lang.perl 

Subject: CALL FOR DISCUSSION: comp.lang.perl.poems 

Message-ID: <0401 @jpl-dewax.JPL.NASA.GOV> 

Date: 1 Apr 90 00:00:00 GMT 

Reply-To: lwall@jpl-dewax.JPL.NASA.GOV (Larry Wall) 
Organization: Jet Prepulsion Laboratory, Pasadena, CA 
Lines: 61 

Mon attention a ete attiree par l'urgente necessite qu'eprouvent les gens a exprimer simultanement leurs 
natures emotionnelle et technique. Plusieurs personnes m'ont envoye des messages qui ne correspon- 
dent a aucun groupe de news. C'est peut-etre parce que j'ai recemment poste simultanement dans 
comp.lang.perl et dans rec.arts.poems que des gens ecrivent des poemes en Perl, et qu'ils me demandent 
oil les poster. En voici un echantillon : 

D'un etudiant en faculte (dans ses dernieres semaines), le haiku suivant : 

study, write, study, 
do review (each word) if time, 
close book, sleep? what's that? 
Et quelqu'un de Fort Lauerdale ecrit : 

sleep, close together, 

sort of sin each spring & wait; 

50% die 

Une personne desirant rester anonyme a ecrit l'exemple suivant de « Black Perl » (le poete de Pearl en 
aurait ete choque, sans aucun doute.) 

BEFOREHAND: close door, each window & exit; wait until time. 

open spellbook, study, read (scan, select, tell us); 
write it, print the hex while each watches, 
reverse its length, write again; 
kill spiders, pop them, chop, split, kill them. 

unlink arms, shift, wait & listen (listening, wait), 
sort the flock (then, warn the "goats" & kill the "sheep"); 
kill them, dump qualms, shift moralities, 
values aside, each one; 

die sheep! die to reverse the system 
you accept (reject, respect); 
next step, 

kill the next sacrifice, each sacrifice, 

wait, redo ritual until "all the spirits are pleased"; 

do it ("as they say"), 
do it(*everyone***must***participate***in***forbidden**s*e*x*) . 
return last victim; package body; 

exit crypt (time, times & "half a time") & close it, 

select (quickly) & warn your next victim; 
AFTERWORDS: tell nobody. 

wait, wait until time; 

wait until next year, next decade; 
sleep, sleep, die yourself, 
die at last 

Je l'ai essaye et il compile effectivement en Perl. II ne semble cependant pas faire grand chose. Ce qui a 
mon avis est probablement heureux... Je propose done la creation de comp.lang.perl.poems pour servir 
de lieu d'accueil pour ces articles, afin que nous ne polluions pas les groupes de news sur perl ou les poe- 
mes avec des choses qui ne seraient d'interet a aucun d'entre eux. Ou bien, nous pouvons creer 
rec.arts.poems.perl pour ceux qui se contentent de compiler, sans rien faire d'utile (il existe des prece- 
dents dans rec.arts.poems, apres tout). Ensuite, creons egalement comp.lang.perl.poems pour ceux qui 
font reellement quelque chose, comme ce haiku personnel : 

print STDOUT q Dust another Perl hacker, 
unless $spring 
Larry Wall lwall@jpl-dewax.jpl.nasa.gov 
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Ce chapitre traite des variables qui ont une signification speciale pour Perl. La plupart 
des noms a ponctuation ont des mnemoniques raisonnables ou des homologues dans 
les shells (ou les deux). Neanmoins, s'il faut utiliser les noms longs de variables, il suffit 
d'ecrire : 

use English; 

au debut du programme. Ceci cree des alias longs pour les noms courts dans le paque- 
tage courant. Certain d'entre eux ont meme des noms moyens, generalement emprun- 
tes a awk. La plupart des gens continuent d'utiliser les noms courts, du moins pour les 
variables les plus courantes. Au long de cet ouvrage, nous employons uniformement les 
noms courts, mais nous mentionnerons aussi les noms longs (entre parentheses) pour 
que vous puissiez facilement les retrouver dans ce chapitre. 

La semantique de ces variables est quelque peu magique (pour creer vos propres sorts, 
voir le chapitre 24, Variables liees). Certaines de ces variables sont en lecture seule. Si Ton 
essaie d'y assigner une valeur, une exception sera lancee. 

Dans ce qui suit, nous donnerons tout d'abord une liste des variables et fonctions aux- 
quelles Perl attribue une signification speciale, classees par type ; ainsi vous pourrez re- 
trouver les variables dont vous n'etes plus tout a fait surs du nom exact. Ensuite nous 
detaillerons toutes les variables par ordre alphabetique, avec leur nom approprie (ou 
leur nom le moins inapproprie). 

Noms speciaux classes par type 

Nous utilisons improprement le mot « type », les sections suivantes regroupent davan- 
tage les variables selon leur contexte, c'est-a-dire depuis l'endroit ou elles sont visibles. 

Variables speciales des expressions regulieres 

Les variables speciales suivantes sont associees a la recherche de motifs. Elles sont visi- 
bles tout au long du contexte dans lequel la recherche a lieu (hormis $*, qui est depre- 
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ciee). Autrement dit, elles se comportent comme si dies etaient declarees avec local, 
vous n'avez done pas besoin de les declarer ainsi vous-meme. Voir le chapitre 5, Recon- 
naissance de motifs. 
$* 

$chiffres 

@+ (@LAST_MATCH_END) 

@- (@LAST_MATCH_START) 

$+ ( $ LAST_PAR E N_MATCH ) 

$ A R ($LAST_REGEXP_CODE_RESULT) 

$& ($MATCH) 

$' ($POSTMATCH) 

$' ($PREMATCH) 

Variables speciales des handles defichiers 

Ces variables speciales n'ont jamais besoin d'etre mentionnees dans un local car elles 
se referent toujours a des valeurs appartenant au handle de sortie actuellement 
selectionne — chaque handle de fichier garde son propre jeu de valeurs. Quand on se- 
lectionne un autre handle de fichier, l'ancien garde ses valeurs et les variables ref letent 
alors les valeurs du nouveau handle de fichier. Voir aussi le module FileHandle dans le 
chapitre 32, Modules standards. 

$| ($AUTOFLUSH, $OUTPUT_AUTOFLUSH) 

$- ($FORMAT_LINES_LEFT) 

$= ($FORMAT_LINES_PER_PACE) 

$~ ($FORMAT_NAME) 

$% ( $FORMAT_PAC E_NUMBER) 

$ A ($F0RMAT_T0_NAME) 

Variables speciales par paquetage 

Ces variables speciales existent separement dans chaque paquetage. II n'est pas besoin 
de les localiser, puisque sort le fait automatiquement pour $a et $b, et qu'il est proba- 
blement preferable de laisser les autres se debrouiller toutes seules (cependant si vous 
employez use strict, vous devrez les declarer avec our). 

$a 
$b 

@EXP0RT 

@EXP0RT_0K 

%EXPORT_TAGS 

%FIELDS 

@ISA 

%0VERL0AD 
$VERSI0N 

Variables speciales pour le programme entier 

Ces variables sont vraiment globales au sens exact du terme — elles signifient la meme 
chose dans chaque paquetage, car elles sont toutes localisees de force dans le paquetage 
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main lorsqu'elles sont non qualifiers (sauf pour @F, qui est speciale dans main, mais pas 
forcee). Si vous voulez une copie temporaire de l'une d'entre elles, vous devez la locali- 
ser dans le contexte dynamique courant. 



%ENV 

%INC 

%SIG 

%\ 

% A H 

@_ 

@ARGV 
@F 

@INC 

$_ ($ARG) 

$0 ($PR0GRAM_NAME) 
$ARGV 

$! ($ERRN0, $0S_ERR0R) 
$" ( $ LI STS E PARATOR ) 
$# 

$$ ($PID, $PR0CESS_ID) 

$( ($GID, $REAL_GR0UP_ID) 

$) ($EGID, $EFFECTIVE_GROUP_ID) 

$, ($0FS, $0UTPUT_F I ELDSE PARATOR) 

$. ($NR, $INPUT_LINE_NUMBER) 

$/ ($RS, $INPUT_REC0RD_SEPARAT0R) 

$ : ($FORMAT_LINE_BREAK_CHARACTERS) 

$; (SSUBSEP, $SUBSCRIPT_SEPARATOR) 



$< (UID, $REAL_USER_ID) 

$> (EUID, $EFFECTIVE_USER_ID) 

$? ($CHILD_ERROR) 

$@ ($EVAL_ERROR) 

$[ 

$\ ($0RS, $OUTPUT_RECORD_SEPARATOR) 

$] ($OLD_PERL_VERSION) 

$ A A ($ACCUMULATOR) 

$ A C ($COMPILING) 

$ A D ($DEBUGGING) 

$ A E ($EXTENDED_OS_ERROR) 

$ A F ($SYSTEM_F D_M AX ) 

$ A H 

$ A I ($INPLACE_EDIT) 
$ A L ($F0RMA_F0RMFEED) 
$ A M 

$ A 0 ($0SNAME) 
$ A P ($PERLDB) 

$ A R ($LAST_REGEXP_DOC_RESULT) 
$ A S ($EXCEPTION_BEING_CAUGHT) 
$ A T ($BASETIME) 
$ A V ($PERL_VERSION) 
$ A W ($WARNING) 
${ A WARNING_BITS} 
${ A WIDE_SYSTEM_CALLS} 
$ A X ($EXECUTABLE_NAME) 



Handles defichiers speciaux par paquetage 

Sauf pour DATA, qui est toujours particulier a un paquetage, les handles de fichiers sui- 
vants sont toujours consideres comme etant dans main lorsqu'ils ne sont pas pleinement 
qualifies dans un autre paquetage. 

(souligne) 
ARGV 
ARGVOUT 
DATA 
STDIN 
STDOUT 
STDERR 



622 



Chapitre 28 — Noms speciaux 



Fonctions speciales par paquetage 

Les noms des routines suivantes ont une signification speciale pour Perl. Elles sont tou- 
jours appelees implicitement suite a un evenement, comme faeces a une variable liee 
ou l'appel une fonction indefinie. Nous ne les decrirons pas dans ce chapitre puisqu'el- 
les sont largement couvertes par ailleurs dans cet ouvrage. 

Fonction indefinie appelant une interception (voir le chapitre 10, Paquetages) : 

AUTOLOAD 

Achievement des objets moribonds (voir le chapitre 12, Objets) : 
DESTROY 

Objets d'exception (voir die dans le chapitre suivant) : 
PROPAGATE 

Fonctions d'auto-initialisation et d'autonettoyage (voir le chapitre 18, Compilation) : 

BEGIN, CHECK, INIT, END 

Methodes de liaison (voir le chapitre 14) : 

BINMODE, CLEAR, CLOSE, DELETE, EOF, EXISTS, EXTEND, FETCH, FETCHIZE, FILENO, 
FIRSTKEY, GETC, NEXTKEY, OPEN, POP, PRINT, PRINTF, PUSH, READ, READLINE, 
SEEK, SHIFT, SPLICE, STORE, STORESIZE, TELL, TIEARRAY, TIEHANDLE, TIEHASH, 
TIESCALAR, UNSHIFT, WRITE 

Variables speciales dans Vordre alphabetique 

Nous avons classe alphabetiquement ces entrees selon le nom long des variables. Si vous 
ne connaissez pas le nom long d'une variable, vous pouvez le trouver dans la section 
precedente. (Les variables sans nom alphabetique sont classees au debut.) 

Pour eviter les repetitions, chaque description de variable debute avec une, ou plu- 
sieurs, des annotations suivantes. 



Annotation 


Signification 


XXX 


Depreciee, ne pas utiliser pour quelque chose de nouveau. 


NON 


Non Officiellement Nommee (pour usage interne seulement). 


GLO 


Reellement globale, partagee par tous les paquetages. 


PKG 


Globale au paquetage ; chaque paquetage peut redefinir sa propre 




variable. 


AHF 


Attribut de handle de fichier ; un attribut par objet d'entree/sortie. 


DYN 


Automatiquement dans un contexte dynamique (entraine GLO). 


LEX 


Dans un contexte lexicographique a la compilation. 


LEC 


En lecture seule ; leve une exception si vous tentez de modifier. 



Quand plus d'un symbole ou plus d'un nom de variable est mentionne, seul le nom 
court est disponible par defaut. En utilisant le module English, les synonymes plus 
longs sont disponibles dans le paquetage courant et uniquement dans le paquetage cou- 
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rant, meme si la variable est marquee avec [GLO]. 

Les entrees de la forme methode HANDLE EXPR montrent l'interface orientee objet des 
variables pourvues par FileHandle et les differents module 10 : : . (Si vous preferez vous 
pouvez aussi utiliser la notation HANDLE->methode(EXPR)). Ceci vous permet d'eviter 
d'appeler select pour changer le handle de sortie par defaut avant d'examiner ou de 
modifier la variable en question. Chacune de ces methodes renvoie l'ancienne valeur 
de l'attribut du FileHandle ; l'attribut prend une nouvelle valeur si Ton positionne l'ar- 
gument EXPR. Si cet argument n'est pas fourni, la plupart des methodes ne modifient 
pas la valeur courante, excepte pour aut of lush, qui suppose que Fargument vaut 1, uni- 
quement pour se distinguer. 

_ (souligne) 

[GLO] II s'agit du handle de fichier special utilise pour garder en cache les informa- 
tions obtenues lors du dernier stat, lstat ou du dernier operateur de test de 
fichier (comme -w $f ile ou -d $file) ayant reussi. 

ichiffres 

[DYN, LEC] Les variables numerotees $1, $2, etc. (aussi eleve que vous le desirez) 1 
contiennent le texte trouve par le jeu de parentheses correspondant dans la der- 
niere recherche de motifs du contexte dynamique actif a cet instant. 
(Mnemonique : comme \chiffres). 

$[ 

[XXX, LEX] L'index du premier element d'un tableau et du premier caractere d'une 
sous-chame. 0 par defaut, mais nous utilisons cette variable positionnee a 1 pour 
que Perl se comporte mieux comme awk (ou FORTRAN) au moment d'indicer et 
d'evaluer les fonctions index et substr. Parce qu'on a trouve cette variable dange- 
reuse, l'affectation de $[ est maintenant traite comme une directive de compilation 
dans un contexte lexical et ne peut pas inf luencer le comportement de tout autre 
fichier. (Mnemonique : [ precede les indices). 

$# 

[XXX, GLO] N'utilisez pas cette variable ; preferez printf. $# contient le format de 
sortie des nombres imprimes, dans une tentative peu convaincante d'emulation de 
la variable OFMT de awk. (Mnemonique : # en anglais signifie numero, mais si vous 
etes pointilleux, mieux vaut oublier tout ceci afin de ne pas trop parasiter votre 
programme et eviter ainsi un sermon). 

$* 

[XXX, GLO] Et bien, trois variables depreciees a la suite ! Celle-ci peut (mais ne doit 
pas) etre positionnee a vrai pour que Perl assume un /m sur chaque recherche de 
motif qui n'a pas explicitement de /s. (Mnemonique : * correspond a de multiples 
quantites). 



1. Bien que beaucoup de moteur depressions regulieres ne supportent que jusqu'a neuf refe- 
rences arrieres, Perl ne possede pas de telle limite ; ainsi si vous ecrivez $768, Perl n'en aura cure, 
bien que ceux qui maintiennent votre code puissent tiquer si vous employez autant de parenthe- 
ses dans vos expressions regulieres. 
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$a 

[PKG] Cette variable est utilisee par la fonction sort pour contenir le premier ele- 
ment de chaque paire de valeurs a comparer ($b est le second element de chaque 
paire). Le paquetage pour $a est le mime que celui oil l'operateur sort a ete com- 
pile, qui n'est pas necessairement celui dans lequel la fonction de comparaison a ete 
compilee. Cette variable est implicitement localisee dans le bloc de comparaison de 
sort. Comme elle est globale, elle est exempte des messages de protestation de use 
strict. Puisque c'est un alias pour la valeur du tableau concerne, on pourrait pen- 
ser qu'on peut la modifier, n'en faites rien. Voir la fonction sort. 

$ ACCUMULATOR 

$ A A 

[GLO] La valeur courante de l'accumulateur de write pour les lignes de format. Un 
format contient contient des commandes f ormline qui emettent leur resultat dans 
$ A A. Apres avoir appele son format, write affiche le contenu de $ A A et le vide. On 
ne voit done jamais le contenu de $ A A a moins d'appeler f ormline soi-meme pour 
l'examiner. Voir la fonction f ormline. 

$ARG 
$_ 

[GLO] L'espace d'entree et de recherche de motifs par defaut. Ces paires sont equi- 
valentes : 

while (<>) {...} # n'est equivalent qu'avec un while sans decorations 
while (defined($_ = <>)) {...} 

chomp 
chomp($_) 

/ A 0bjet:/ 

$_ =~ / A 0bjet:/ 

tr/a-z/A-Z/ 

$_ = ~ tr/a-z/A-Z/ 

Voici les endroits oil Perl prend $_ si Ton ne specifie pas d'operande aux fonctions 
et operateurs : 

• Des fonctions de listes comme print et unlink et des fonctions unaires comme 
ord, pos et int, ainsi que tous les tests de fichier (sauf pour -t, qui prend STDIN 
par defaut). Toutes les fonctions qui prennent par defaut $_ sont reperees en 
tant que telles dans le chapitre 29, Fonctions. 

• Les operations de recherche de motifs m// et si 1 1 et les operations de transfor- 
mation y/// et tr///, lorsqu'on les utilise sans l'operateur =~. 

• La variable d'iteration dans une boucle foreach (meme si on l'epele for ou 
lorsqu'on l'utilise avec un modificateur d'instruction) si aucune autre variable 
n'est fournie. 

• La variable d'iteration implicite dans les fonctions grep et map. (II n'y a aucun 
moyen de specifier une variable differente pour ces fonctions.) 
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• L'endroit par defaut oil est place un enregistrement en entree quand le resultat 
d'une operation <HF>, readline ou glob est teste en tant qu'unique critere d'un 
while. Cette affectation ne se produit pas en dehors d'un while ou si un quel- 
conque element additionnel est inclus dans l'expression while. 

(Mnemonique : le souligne est l'operande sous-jacente de certaines operations). 

@ARG 

[GLO] Dans un sous-programme, ce tableau contient la liste d'arguments passee a 
ce sous-programme. Voir le chapitre 6, Sous-programmes. Un split dans un contexte 
scalaire s'applique sur ce tableau, mais cet usage est deprecie. 

ARGV 

[GLO] Le handle de fichier special qui parcourt les noms de fichiers de la ligne de 
commande et contenus dans @ARGV Habituellement, on l'ecrit comme le handle de 
fichier nul dans l'operateur d'angle <>. 

$ARGV 

[GLO] Contient le nom du fichier courant lorsqu'on lit depuis le handle de fichier 
ARGV en utilisant les operateurs <> ou readline. 

@ARGV 

[GLO] Le tableau contenant les arguments de la ligne de commande prevus pour le 
script. Remarquez que $#ARGV est generalement le nombre d'arguments moins un, 
puisque $ARGV[o] est le premier argument et non le nom de la commande ; utilisez 
scalar @ARGV pour le nombre d'arguments du programme. Voir $0 pour le nom 
du programme. 

ARGVOUT 

[GLO] Ce handle de fichier special est utilise lorsqu'on traite le handle de fichier 
ARGV avec l'option -i ou la variable $ A I. Voir l'option -i dans le chapitre 19, Winter- 
face de ligne de commande. 

$b 

[PKG] Cette variable, sceur de $a, est utilisee dans les comparaisons avec sort. Voir 
$a et la fonction sort pour les details. 

$BASETIME 
$ A T 

[GLO] Le moment oil le script a commence a tourner, en secondes depuis l'origine 
(le debut de 1970, pour les systemes Unix). Les valeurs renvoyees par les tests de 
fichier -M, -A et -C sont basees sur ce moment. 

$CHILD_ERR0R 

$? 

[GLO] Le statut renvoye par la derniere fermeture de tube, la derniere commande 
en apostrophe inverse (") ou les fonctions wait, waitpid ou system. Remarquez 
qu'il ne s'agit pas simplement du code retour, mais le mot entier de 16-bits du sta- 
tut renvoye par les appels systeme sous-jacents wait(2) ou waitpid(2) (ou leurs equi- 
valents). Ainsi, la valeur de retour du sous-programme se trouve dans l'octet de 
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poids fort, c'est-a-dire, $? >> 8 ; dans l'octet de poids faible, $? & 127 donne quel 
signal (s'il y en a un) a tue le processus, alors que $? & 128 rapporte si sa dispari- 
tion a produit un core dump. (Mnemonique : similaire a $? dans sh et sa progeni- 
ture). 

A Finterieur d'un bloc END, $? contient la valeur qui va etre donnee a exit. Vous 

pouvez modifier $? dans un END pour changer le statut retour du script. 

Sous VMS, le pragma use vmsish 'status' fait que $? reflete le veritable statut de 

retour de VMS, au lieu de F emulation par defaut du statut POSIX. 

Si la variable h_errno est supportee en C, sa valeur numerique est retournee via $? 

si Fune des fonctions gethost*() echoue. 

$COMPILING 

$ A C 

[GLO] La valeur courante de l'argument interne associe a Foption -c, principale- 
ment utilise avec -MO et Foutil £>er/cc(%) pour laisser le code modifier son comporte- 
ment lorsqu'il est compile pour la generation de code. Par exemple, vous pouvez 
avoir envie d'executer AUTOLOAD pendant la phase de compilation, au lieu d'utiliser 
le chargement differe habituel, de sorte que le code sera genere immediatement. 
Voir le chapitre 18. 

DATA 

[PKG] Ce handle de fichier special se refere a tout ce qui suit soit le token END 

ou le token DATA dans le fichier courant. Le token END ouvre toujours le 

handle de fichier main: :DATA, ainsi il est utilise dans le programme principal. Le 

token DATA ouvre le handle de fichier DATA dans n'importe quel paquetage 

effectif a ce moment. Ainsi differents modules peuvent posseder leur propre han- 
dle de fichier DATA, puisqu'ils ont (on le presume) des noms de paquetage diffe- 
rents. 

$DEBUGGING 

$ A D 

[GLO] La valeur courante des arguments internes, positionnes par Foption -D de la 
ligne de commande ; voir le chapitre 19 pour les valeurs de bit. (Mnemonique : 
valeur de Foption -D). 

$EFFECTIVE_GROUP_ID 
$EGID 

$) 

[GLO] Le gid (group ID) effectif de ce processus. Si vous vous trouvez sur une 
machine qui accepte que Fon soit membre de plusieurs groupes simultanement, $) 
donne une liste des groupes concerned, separes par des espaces. Le premier nombre 
est celui qui est renvoye par getgid(2), et les suivants par getgroups(2), Fun d'entre 
eux pouvant etre identique au premier nombre. 

De meme, une valeur assignee a $) doit egalement etre une liste de nombres sepa- 
res par des espaces. Le premier nombre est utilise pour positionner le GID effectif, 
et les autres (s'il y en a) sont passes a l'appel systeme setgroups(2). Pour obtenir 
Feffet d'une liste vide pour setgroups, il suffit de repeter le nouveau GID effectif ; 
par exemple, pour forcer un GID effectif de 5 et une liste vide effective pour 
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setgroups : 
$) = "5 5"; 

(Mnemonique : les parentheses sont employees pour regrouper les choses. Le GID 
effectif est le groupe qui est fermement le bon, si votre script est lance avec setgid. II 
faut done une parenthese fermante). Remarque : $<, $>, $( et $) ne peuvent etre 
modifies que sur des machines qui supportent la routine systeme set-id correspon- 
dante. $( et $) ne peuvent etre echanges que sur des machines supportant setre- 
gid(2). 

$EFFECTIVE_USER_ID 
$EUID 

$> 

[GLO] L'UID effectif de ce processus tel que renvoye par l'appel systeme geteuid(2). 
Exemple : 

$< = $>; # mettre l'uid reel a l'uid effectif 

($<, $>) = ($>, $<); # echanger l'uid reel et l'uid effectif 
(Mnemonique : il s'agit de l'UID vers lequel vous etes parvenus si votre script est 
lance avec setuid). Remarque : $< et $> ne peuvent etre echanges que sur des machi- 
nes qui supportent setreuid(2). Parfois mime, cela ne suffit pas. 

%ENV 

[GLO] Le hachage contenant les variables de l'environnement courant. Modifier 
une valeur dans %ENV change l'environnement a la fois pour votre processus et pour 
les processus fils lances apres l'affectation. (On ne peut modifier l'environnement 
d'un processus parent sur aucun systeme ressemblant a Unix). 

$ENV{PATH} = "/bin:/usr/bin;" 

$ENV{ PAGER} = "less"; 

$ENV{LESS} = "MOeicsnf"; # nos options favorites pour less(l) 
system "man perl"; # recupere les nouveaux parametres 

Pour supprimer quelque chose dans votre environnement, soyez stir d'utiliser la 
fonction delete au lieu d'un undef sur la valeur du hachage. 
Remarquez que les processus qui sont lances par une entree de crontab(5) heritent 
d'un jeu de variables d'environnement particulierement appauvri. (Si votre pro- 
gramme fonctionne parfaitement depuis la ligne de commande mais pas avec cron, 
e'est probablement la cause). Remarquez egalement que vous devez modifier 
$ENV{PATH}, $ENV{SHELL}, $ENV{BASH_ENV}, et $ENV{IFS} si votre script est lance 
avec setuid. Voir le chapitre 23, Securite. 

$EVAL_ERROR 

$@ 

[GLO] L'exception courante levee ou le message d'erreur de syntaxe Perl de la der- 
niere operation eval. (Mnemonique : quelle est « l'adresse » de la derniere erreur 
de syntaxe ?) Contrairement a $ ! ($0S_ERR0R), qui est positionne sur un echec mais 
pas nettoye lors d'un succes, on a la garantie que $@ est bien positionne (a une 
valeur vraie) si le dernier eval a engendre une erreur de compilation ou une excep- 
tion a l'execution, mais aussi la garantie que $@ est nettoye (a une valeur fausse) si 
aucun de ces problemes ne survient. 
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Les messages d'avertissement ne sont pas collectes dans cette variable. Cependant, 
vous pouvez installer une routine destinee a traiter les avertissements en position- 

nant $SIC{ WARN } comme decrit plus loin dans cette section. 

Remarquez que la valeur de $@ peut etre un objet exception plutot qu'une chaine. 
Dans ce cas, vous pouvez toujours le traiter comme une chaine pourvu que Fobjet 
exception ait defini une surcharge de la transformation en chaine (N.d.T. : stringifi- 
cation overload) pour sa classe. Si vous propagez une exception en ecrivant : 
die if $@; 

alors un objet exception appellera $@->PROPAGATE pour savoir que faire. (Une 
chaine exception ajoutera une ligne « propagee a » a la chaine.) 

$EXCEPTIONS_BEING_CAUGHT 

$ A S 

[GLO] Cette variable reflete la situation courante de l'interpreteur, en retournant 
vrai a l'interieur d'un eval, faux sinon. Elle est indefinie si l'analyse de l'unite cou- 
rante de compilation n'est pas encore finie, ce qui peut etre le cas dans les gestion- 

naires de signaux $SIG{ DIE } et $SIG{ WARN }. (Mnemonique : situation de 

eval.) 

$EXECUTABLE_NAME 

$ A X 

[GLO] Le nom avec lequel le binaire perl lui-meme a ete execute, provient de 
argv[o] en C. 

@EXP0RT 

[PKG] Ce tableau est consulte par la methode import du module Exporter pour 
trouver la liste des variables et sous-programmes d'autres paquetages qui doivent 
etre exportes par defaut quand le module est utilise (avec use) ou lorsqu'on 
emploie l'option d'importation : DEFAULT. II n'est pas exempt des complaintes de 
use strict, ainsi il doit etre declare avec our ou pleinement qualifie avec le nom 
du paquetage si vous avez active ce pragma. De toute facon, toutes les variables qui 
commencent par « EXPORT » sont exemptes des avertissements comme quoi elles ne 
sont utilisees qu'une seule fois. Voir le chapitre 11, Modules. 

@EXP0RT_0K 

[PKG] Ce tableau est consulte par la methode import du module Exporter pour 
determiner si une requete d'importation est legale. II n'est pas exempt des com- 
plaintes de use strict. Voir le chapitre 11. 

%EXPORT_TAGS 

[PKG] Ce hachage est consulte par la methode import du module Exporter 
lorsqu'on requiert un symbole d'importation debutant par deux points, comme 
dans use POSIX " : queue". Les cles sont les tags commencant par deux points mais 
sans les deux points (comme sys_wait_h). Les valeurs doivent etre des references a 
des tableaux contenant les symboles a importer lorsqu'on requiert ce tag ; toutes les 
valeurs du hachage doivent egalement apparaitre soit dans @EXP0RT, soit dans 
@EXP0RT_0K. Ce hachage n'est pas exempt des complaintes de use strict. Voir le 
chapitre 11. 
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$EXTENDED_OS_ERROR 

$ A E 

[GLO] Information d'erreur specif ique au systeme d'exploitation courant. Sous 
Unix, $ A E est identique a $! ($OS_ERROR), mais elle differe sous OS/2, VMS, les 
systemes Microsoft et MacPerl. Consultez les informations sur votre portage pour 
les specificites. Les mises en garde mentionnees dans la description de $ ! s'appli- 
quent aussi a $ A E en general . (Mnemonique : explication etendue d'erreur.) 

@F 

[PKG] Le tableau dans lequel les lignes d'entree sont eclatees quand la ligne de 
commande comporte Foption -a est donnee. Si Foption -a n'est pas utilisee, ce 
tableau n'a aucune signification particuliere (ce tableau n'est en fait que @main : : F 
et non dans tous les paquetages a la fois). 

%FIELDS 

[NON, PKG] Ce hachage est utilise en interne par le pragma use fields pour 
determiner les champs legaux courants dans un objet hachage. Voir use fields, 
use base et Declarations de champ avec use fields au chapitre 12. 

format_formfeed HANDLE EXPR 
$FORMAT_FORMFEED 

$ A L 

[GLO] Ce qu'une fonction write genere implicitement pour effectuer un saut de 
page avant d'emettre un en-tete de page. "\f " par defaut. 

format_lines_left HANDLE EXPR 

$FORMAT_LINES_LEFT 

$- 

[AHF] Le nombre de lignes restantes dans la page du canal de sortie actuellement 
selectionne, pour une utilisation avec la declaration format et la fonction write. 
(Mnemonique : lines_on_pages lines_printed.) 

format_lines_per_page HANDLE EXPR 

$ F0RMAT_ L I N E S_P E R_PAG E 

$= 

[AHF] La longueur de la page courante (lignes imprimables) du canal de sortie 
actuellement selectionne, pour une utilisation avec format et write. 60 par defaut. 
(Mnemonique : est compose des lignes horizontales.) 

format_line_break_characters HANDLE EXPR 

$FORMAT_LINE_BREAK_CHARACTERS 

$: 

[GLO] Le jeu de caracteres courant d'apres lequel une chame peut etre scindee pour 
remplir les champs de continuation (commencant par A ) dans un format. " \n-" 
par defaut, pour couper sur l'espace ou le tiret. (Mnemonique : un « deux-points » 
en poesie fait partie d'une ligne. Maintenant il ne vous reste plus qu'a vous rappe- 
ler du procede mnemonique. . . ) 
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formatjiame HANDLE EXPR 
$FORMAT_NAME 

$~ 

[AHF] Le nom du format de rapport courant pour le canal de sortie actuellement 
selectionne. Le nom du handle du fichier par defaut. (Mnemonique : cette variable 
tourne apres $ A .) 

format_page_number HANDLE EXPR 
$ FORMAT_PAGE_NUMB E R 

$% 

[AHF] Le numero de page courant du canal de sortie actuellement selectionne, 
pour une utilisation avec format et write. (Mnemonique : % est le registre de 
numero de page dans troff(l). Quoi, vous ne savez pas ce qu'est troff?) 

format_top_name HANDLE EXPR 
$F0RMAT_T0P_NAME 

$ A 

[AHF] Le nom du format d'en-tete de page courant pour le canal de sortie actuelle- 
ment selectionne. Le nom du handle de fichier auquel est ajoute _TOP par defaut. 
(Mnemonique : pointe vers le haut de la page.) 

$ A H 

[NON, LEX] Cette variable contient les bits de statut du contexte lexical (autrement 
dit, des indications) pour le parseur Perl. Cette variable est strictement reservee a 
une utilisation interne. Sa disponibilite, son comportement et son contenu sont 
sujets a modifications sans preavis. Si vous y touchez, vous perirez indubitablement 
d'une mort horrible causee par une detestable maladie tropicale inconnue de la 
science. (Mnemonique : nous ne vous donnerons aucune indication.) 

% A H 

[NON, LEX] Le hachage % A H fournit la meme semantique de contexte lexical que 
$ A H, le rendant utile pour l'implementation des pragmas de contexte lexical. Lisez 
les affreuses mises en garde enoncees pour $ A H, et ajoutez-y le fait que cette varia- 
ble est encore experimentale. 

%INC 

[GLO] Le hachage contenant les entrees de noms de fichiers pour chaque fichier 
Perl charge via do FICHIER, require ou use. La cle est le nom du fichier specifie, et 
la valeur est l'endroit ou le fichier a ete veritablement trouve. L'operateur require 
utilise ce tableau pour determiner si un fichier donne a deja ete charge. Par exem- 
ple : 

% perl -MLWP:: Simple -le 'print $INC{LWP/Simple.pm}' 

/usr/local/lib/perl/5.6.0/lib/site_perl/LWP/Simple.pm 

@INC 

[GLO] Le tableau contenant la liste des repertoires ou les modules Perl peuvent 
etre trouves par do FICHIER, require ou use. Initialement, il se compose des argu- 
ments de n'importe quelle option -I de la ligne de commande et des repertoires de 
la variable d'environnement PERL5LIB, suivis par les bibliotheques par defaut de 
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Perl, comme : 

/usr/local/lib/perl5/5.6.0/i386-linux 
/usr/local/lib/perl5/5.6.0 

/usr/local/lib/perl5/site_perl/5.6.0/i386-linux 

/usr/local/lib/perl5/site_perl/5.6.0 

/usr/local/lib/perl5/site_perl/5.00552/i386-linux 

/usr/local/lib/perl5/site_perl/5. 00552 

/usr/local/lib/perl5/site_perl/5.005/i386-linux 

/usr/local/lib/perl5/site_perl/5.005 

/usr/local/lib/perl5/site_perl 

suivies par « . », qui represente le repertoire courant. Si vous avez besoin de modi- 
fier cette liste depuis votre programme, essayer le pragma use lib, qui non seule- 
ment modifie la variable durant la compilation, mais qui fait egalement des ajouts 
dans tous les repertoires dependant de l'architecture (comme ceux qui contiennent 
les bibliotheques partagees utilisees par les modules XS) : 
use lib "/monchemin/lib/"; use UnModule; 

$INPLACE_EDIT 

$ A I 

[GLO] La valeur courante de l'extension d'edition sur place. Employez undef pour 
desactiver l'edition sur place. Vous pouvez utilisez ceci a l'interieur de votre pro- 
gramme pour obtenir le mime comportement qu'avec l'option -i. Par exemple, 
pour produire l'equivalent de cette commande : 

% perl -i.orig -pe 's/machin/truc/g' *.c 
vous pouvez utiliser le code suivant dans votre programme : 

local $ A I = ' .orig'; 

local @ARGV = glob("*.c"); 

while (<>) { 

s/machin/truc/g; 
print; 

} 

(Mnemonique : la valeur de l'option -i.) 

$INPUT_LINE_NUMBER 

$NR 

$. 

[GLO] Le numero de l'enregistrement courant (generalement le numero de ligne) 
pour le dernier handle de fichier dans lequel vous avez lu (ou sur lequel vous avez 
appele seek ou tell). La valeur peut etre differente de la ligne physique actuelle, 
selon la definition a ce moment de ce qu'est une « ligne » — voir $/ 
($INPUT_RECORD_NUMBER) pour la maniere de choisir cette definition). Un close 
explicite sur un handle de fichier reinitialise a zero le numero de ligne. Comme <> 
n'effectue jamais de close explicite, les numeros de ligne augmentent en parcou- 
rant les fichiers ARGV (mais voyez les exemples de eof). La mise en local de $. a 
egalement pour effet de mettre en local la notion que Perl a du « dernier handle de 
fichier lu ». (Mnemonique : de nombreux programmes utilise « . » pour le 
numero de ligne courant.) 
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$INPUT_RECORD_SEPARATOR 

$RS 

$/ 

[GLO] Le separateur d'enregistrement en entree, le caractere « saut de ligne » par 
defaut, celui qui est consulte par la fonction readline, l'operateur <HF>, et la fonc- 
tion chomp. II se comporte comme la variable RS de awk, et, s'il contient la chaine 
nulle, traite une ou plusieurs lignes blanches comme des delimiteurs d'enregistre- 
ments. (Mais une ligne vide ne doit contenir aucun espace cache ou aucune tabula- 
tion). Vous pouvez affecter a cette variable une chaine de plusieurs caracteres pour 
correspondre a un separateur sur plusieurs caracteres, mais vous ne pouvez pas lui 
affecter un motif — il faut bien que awk soit meilleur dans un domaine. 
Remarquez que le fait d'affecter "\n\n" a $/ signifie quelque chose de sensiblement 
different que de lui affecter "", si le fichier contient des lignes blanches consecuti- 
ves. "" traitera deux lignes blanches consecutives ou plus comme une seule ligne 
blanche. "\n\n" signifie que Perl suppose aveuglement qu'une troisieme ligne 
appartient au paragraphe suivant. 

Si Ton rend carrement $/ indefini, la prochaine operation de lecture de ligne ava- 

lera le reste du fichier dans une seule valeur scalaire : 
undef $/; # enclenche le mode "cul-sec" 

$_ = <HF>; # maintenant le fichier entier est ici 

s/\n[ \t]+/ /g; # aplatit les lignes indentees 

Si vous utilisez la construction while (<>) pour acceder au handle de fichier ARGV 
alors que $/ vaut undef, chaque lecture prend le fichier suivant : 
undef $/; 

while (<>) { # $_ contient le prochain fichier dans sa totalite 
} 

Bien que nous ayons employe undef ci-dessus, il est plus sur de rendre $/ indefini 
en utilisant local : 

{ 

local $/; 
$_ = <HF>; 

} 

Affecter a $/ une reference soit a un entier, soit a un scalaire contenant un entier, 
soit a un scalaire convertible en entier, fera que les operations readline et <HF> 
liront des enregistrements de taille fixe (avec la taille maximale d'enregistrement 
valant Fender reference) au lieu d'un enregistrement de taille variable termine par 
une chaine particuliere. Ainsi, ceci : 

$/ = 32768; # ou \"32768" ou \$var_scalaire_contenant_32768 

open(FICHIER, $monfichier); 

$enregistrement = <FICHIER>; 
lira un enregistrement d'au plus 32768 octets depuis le handle de FICHIER. Si vous 
ne lisez pas un fichier structure par enregistrement (N.d.T. : record-oriented file) (ou 
si votre systeme d'exploitation ne connait pas les fichiers structures par enregistre- 
ment), alors vous aurez vraisemblablement un morceau de donnees a chaque lec- 
ture. Si un enregistrement est plus volumineux que la taille que vous avez fixee, 
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vous recevrez l'enregistrement decoupe en plusieurs tranches. Le mode par 
« enregistrement » ne se marie bien avec le mode par ligne que sur les systemes oil 
les entrees/sorties standards fournissent une fonction read(3) ; VMS est une excep- 
tion notoire. 

Un appel a chomp lorsque $/ est positionnee sur le mode par enregistrement — ou 
lorsqu'elle n'est pas defmie — n'a aucun effet. Voir aussi les options de la ligne de 
commande -0 (le chiffre) et -1 (la lettre) dans le chapitre 19. (Mnemonique : / est 
utilise pour separer les lignes lorsque Ton cite de la poesie.) 

(ffllSA 

[PKG] Ce tableau contient les noms des autres paquetages dans lesquels il faut 
rechercher une methode qui n'a pu etre trouvee dans le paquetage courant. Autre- 
ment dit, il contient les classes de base du paquetage. Le pragma use base posi- 
tionne ceci implicitement. Il n'est pas exempt des complaintes de use strict. Voir 
le chapitre 12. 

@LAST_MATCH_END 

[DYN,LEC] Ce tableau contient les positions des fins des sous-elements de la der- 
niere recherche de correspondance ayant reussi dans le contexte dynamique actuel- 
lement actif. $- [0] est la position a la fin de la correspondance entiere. II s'agit de la 
meme valeur que celle retournee par la fonction pos lorsqu'on l'appelle avec 
comme parametre la variable sur laquelle s'est faite la recherche de correspon- 
dance. Lorsque nous parlons de « la position de la fin », nous voulons reellement 
dire la position du premier caractere qui suit la fin de ce qui a correspondu, ainsi 
nous pouvons soustraire les positions de debut aux positions de fin pour obtenir la 
longueur. Le nieme element de ce tableau contient la position du meme element 
de la correspondance, ainsi $+[i] est la position oil finit $1, $+[2] la position oil $2 
finit, etc. Vous pouvez utiliser $#+ pour determiner combien d'elements ont reussi 
a correspondre dans la derniere recherche. Voir aussi @- (@LAST_MATCH_START). 
Apres une recherche de correspondance reussi sur une variable $var : 
$' est identique a substr($var, 0, $-[0]) 

• $& est identique a substr($var, $-[o], $+[o] - $-[0]) 
$' est identique a substr($var, $+[0]) 

• $1 est identique a substr($var, $-[l], $+[l] - $-[l]) 

• $2 est identique a substr($var, $-[2], $+[2] - $-[2]) 

• $3 est identique a substr($var, $-[3], $+[3] - $-[3]), etc. 
@LAST_MATCH_START 

[DYN,LEC] Ce tableau contient les positions des debuts des sous-elements de la 
derniere recherche de correspondance ayant reussi dans le contexte dynamique 
actif. $ - [0] est la position au debut de la correspondance entiere. Le nieme element 
de ce tableau contient la position du nieme element de la correspondance, ainsi $- 
[l] est la position oil debute $1, $- [2] la position oil $2 debute, etc. Vous pouvez 
utiliser $#- pour determiner combien d'elements ont reussi a correspondre dans la 
derniere recherche. Voir aussi @+ (@LAST_MATCH_END). 
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$ LAST_PAR E N_MATCH 
$+ 

[DYN, LEC] Cette variable renvoie ce qu'a trouve la derniere recherche de paren- 
these dans le contexte dynamique actuellement actif C'est utile si Ton ne sait pas 
(ou si Ton ne s'en preoccupe pas) lequel des motifs parmi une alternative a ete trou- 
vee. (Mnemonique : Soyez positifs et regardez droit devant.) Exemple : 
$rev = $+ if /Version: (.*) |Revision: (.*)/; 

$LAST_REGEXP_CODE_RESULT 

$ A R 

[DYN] Cette variable contient le resultat du dernier morceau de code execute au 
sein d'une recherche de motifs reussie construite avec (?{ CODE }). $ A R vous donne 
un moyen d'executer du code et d'en retenir le resultat pour Futiliser plus tard dans 
le motif, ou mime encore apres. 

Comme le moteur d'expressions regulieres de Perl se deplace tout au long du motif, 
il peut rencontrer de multiples expressions (?{ CODE }). Lorsque cela arrive, il 
retient chaque valeur de $ A R de maniere a ce qu'il puisse restaurer l'ancienne valeur 
de $ A R si plus tard il doit reculer avant l'expression. En d'autres termes, $ A R possede 
un contexte dynamique au sein du motif, un peu comme $1 et ses amis. 
Ainsi, $ A R n'est pas juste le resultat du dernier morceau de code execute au sein 
d'un motif. C'est le resultat du dernier morceau de code qui a conduit au succes de la 
correspondance. Un corollaire est que si la correspondance a echoue, $ A R reprendra 
la valeur qu'elle avait avant la correspondance. 

Si le motif (?{ CODE }) est employe directement comme la condition d'un sous- 
motif (? (CONDITION )SI_VRAI | SI_FAUX), $ A R n'est pas valorisee. 

$LIST_SEPARATOR 
$" 

[GLO] Lorsqu'un tableau ou une tranche est interpole dans une chaine entre 
guillemets (ou un equivalent), cette variable indique la chaine a mettre entre les 
elements individuels. Un espace par defaut. (Mnemonique : on peut esperer que 
c'est evident.) 

$ A M 

[GLO] Par defaut, on ne peut pas intercepter un depassement de memoire. Toute- 
fois, si votre perl a ete compile pour beneficier de $ A M, vous pouvez Futiliser 
comme un espace memoire en cas d'urgence. Si votre Perl est compile avec - 
DPERL_EMERCENCY_SBRK et utilise le malloc de Perl, alors : 

$ A M = 'a' x (1 < < 16); 
allouera un tampon de 64K en cas d'urgence. Voir le fichier INSTALL dans le reper- 
toire du code source de la distribution Perl pour les informations sur la maniere 
d'activer cette option. 

En guise d'effet dissuasif pour l'emploi de cette fonctionnalite avancee, il n'y a pas 
de nom long avec use English pour cette variable (et nous ne vous dirons pas quel 
est le procede mnemonique). 
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$MATCH 
$& 

[DYN, LEC] La chame trouvee par la derniere recherche de motif dans le contexte 
dynamique actuellement actif (Mnemonique : comme & dans certains editeurs.) 

$OLD_PERL_VERSION 
$] 

[GLO] Renvoie la version + niveau_de_patch/1000. On peut l'utiliser pour determi- 
ner au debut du script si l'interpreteur Perl qui execute le script est dans une plage 
de versions correcte. (Mnemonique : cette version de Perl est-elle dans le bon 
intervalle ? L'intervalle mathematique etant represents par un crochet). Exemple : 

warn "Pas de somme de controle !\n" if $] < 3.019; 

die "Exige la disponibilite du prototypage\n" if $] < 5.003; 
Voir aussi la documentation de use VERSION et require VERSION pour un moyen 
convenable d'echouer si l'interpreteur Perl est trop ancien. Voir $ A V pour une 
representation UTF-8 plus flexible de la version de Perl. 

$0SNAME 

$ A 0 

[GLO] Cette variable contient le nom de la plate-forme (generalement du systeme 
d'exploitation) pour laquelle le binaire Perl courant a ete compile. Elle sert surtout 
a ne pas appeler le module Conf ig. 

$0S_ERR0R 

$ERRN0 

$! 

[GLO] Dans un contexte numerique, donne la valeur courante de la derniere 
erreur d'appel systeme, avec toutes les restrictions d'usage. (Ce qui signifie qu'il 
vaut mieux ne pas attendre grand chose de la valeur de $ ! a moins qu'une erreur 
renvoyee n'indique specifiquement une erreur systeme). Dans un contexte de 
chaine, $ ! donne la chame du message d'erreur correspondant. Vous pouvez assi- 
gner un numero d'erreur a $ ! si, par exemple, vous voulez que $ ! renvoie la chaine 
correspondant a cette erreur particuliere, ou si vous voulez positionner la valeur de 
sortie de die. Voir aussi le module Errno au chapitre 32. (Mnemonique : j'ai 
entendu qu'on venait de s'exclamer ?) 

%0S_ERR0R 

%ERRN0 

%! 

[GLO] Ce hachage n'est defini que si vous avez charge le module standard Errno 
decrit au chapitre 32. Une fois ceci fait, vous pouvez acceder a % ! en utilisant une 
chaine d'erreur particuliere, et sa valeur n'est vraie que s'il s'agit de l'erreur cou- 
rante. Par exemple, $!{EN0EI\IT} n'est vraie que si la variable C errno vaut a ce 
moment la valeur de ENOENT dans le #def ine en C. C'est un moyen pratique d'acce- 
der aux symboles specifiques d'un fabriquant. 
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autoflush HANDLE EXPR 

$OUTPUT_AUTOFLUSH 

$AUTOFLUSH 

$1 

[AHF] Si elle est positionnee a vrai, cette variable force un tampon a etre vide apres 
chaque print, printf et write sur le handle de sortie actuellement selectionne. 
(C'est ce que nous appelons vidage du tampon de commande. Contrairement a la 
croyance populaire, positionner cette variable ne desactive pas le vidage du tam- 
pon.) Elle vaut faux, par defaut, ce qui signifie sur de nombreux systemes que 
STDOUT est vide ligne par ligne si la sortie s'effectue sur terminal, et vide bloc par 
bloc si ce n'est pas le cas, meme dans les tubes et les sockets. Positionner cette varia- 
ble est utile lorsque vous envoyez la sortie vers un tube, comme lorsque vous lancez 
un script Perl sous rsh(l) et que vous voulez en voir la sortie en temps reel. Si vous 
avez des donnees en attente d'etre videes dans le tampon du handle de fichier 
actuellement selectionne lorsque cette variable est positionnee a vrai, ce tampon 
sera immediatement vide par effet de bord de Faffectation. Voir la forme a un seul 
argument de select pour des exemples de controle du tampon sur les handles de 
fichier autres que STDOUT. (Mnemonique : quand vous voulez que vos tubes soient 
fumants.) 

Cette variable n'a aucun effet sur le vidage du tampon d'entree ; pour ceci, voir 
getc dans le chapitre 29 ou l'exemple dans le module POSIX au chapitre 32. 

$OUTPUT_FIELD_SEPARATOR 

$0FS 

$, 

[GLO] Le separateur de champs en sortie (le limitateur, en fait) pour print. Nor- 
malement, print affiche simplement la liste d'elements que vous specifiez sans 
rien entre eux. Affecter cette variable fera specifier a la variable OFS de awk ce qui 
doit etre affiche entre les champs. (Mnemonique : ce qui est affiche quand il y a 
une « , » dans l'instruction print.) 

$OUTPUT_RECORD_SEPARATOR 

$0RS 

$\ 

[GLO] Le separateur d'enregistrement en sortie (le delimiteur, en fait) pour print. 
Normalement, print affiche simplement les champs separes par des virgules que 
vous avez specifie, sans saut de ligne final, ni separateur d'enregistrements. Affectez 
cette variable, comme vous auriez affecte la variable ORS de awk, pour specifier ce 
qui est affiche a la fin du print. (Mnemonique : vous assignez $\ au lieu d'ajouter 
"\n" a la fin du print. De meme, cette variable ressemble a /, mais pour ce que 
Perl « retourne ».) Voir aussi l'option de la ligne de commande -1 (pour « ligne ») 
dans le chapitre 19 

%0VERL0AD 

[NON, PKG] Ces entrees de hachage sont positionnees en interne grace au pragma 
use overload pour implementer la surcharge d'operateur pour les objets de la 
classe du paquetage courant. Voir le chapitre 13, Surcharge. 
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$PERLDB 
$ A P 

[NON, GLO] La variable interne pour activer le debogueur Perl (perl -d). 

$PERL_VERSION 

$ A V 

[GLO] La revision, la version, et la sous-version de l'interpreteur Perl, representes 
comme une « chaine de version » binaire. Les v-chaines n'ont generalement pas de 
valeur numerique, mais cette variable est doublement valuee, et elle a une valeur 
numerique equivalente a l'ancienne variable $] ; c'est-a-dire un nombre a virgule 
valant revision + version/1000 + sous-version/1000000. La valeur de la chaine est 
composee des caracteres UTF8 : chr($revision) . chr($version) 
chr ($sous_version). Cela signifie que $ A V n'est pas affichable. Pour 1'afFicher, vous 
devez ecrire : 

printf "%vd", $ A V; 

Dans les bons cotes, cela veut egalement dire que la comparaison normale de chai- 
nes peut etre utilisee pour determiner si l'interpreteur Perl qui execute votre script 
est dans une plage de versions correcte. (Ceci s'applique a n'importe quelle version 
numerique representee avec des v-chames, pas seulement celles de Perl). Exemple : 

warn "Pas de declarations avec 'our-'W if $ A V It v5.6; 
Voir la documentation de use VERSION et require VERSION pour un moyen conve- 
nable d'echouer si l'interpreteur Perl est plus ancien que ce que vous esperiez. Voir 
aussi $] pour la representation originelle de la version de Perl. 

$POSTMATCH 
$' 

[DYN, LEC] La chaine qui suit tout ce qui a ete trouve par la derniere recherche de 
motif reussie dans le contexte dynamique actuellement actif. (Mnemonique : ' suit 
souvent une chaine protegee.) Exemple : 

$_ = 'abcdefghi'; 

/def/; 

print "$':$&:$\n"; # affiche abc:def:ghi 
A cause du contexte dynamique, Perl ne peut pas savoir quel motif aura besoin de 
sauvegarder ses resultats dans ces variables, ainsi mentionner $' ou $' n'importe 
oil dans le programme enframe une penalisation dans les performances pour tou- 
tes les recherches de motif tout au long du programme. Ce n'est pas un gros pro- 
bleme dans les programmes courts, mais vous voudrez probablement eviter cette 
paire de variables si vous ecrivez le code d'un module reutilisable. L'exemple ci-des- 
sus peut etre reecrit de maniere equivalente, mais sans le probleme de performan- 
ces globales, ainsi : 

$_ = 'abcdefghi'; 

/(.*?)(def)(.*)/s # /s au cas ou $1 contiendrait des sauts de ligne 
print "$l:$2:$3\n"; # affiche abc:def:ghi 

$PREMATCH 

V 

[DYN, LEC] La chaine qui precede tout ce qui a ete trouve par la derniere recher- 
che de motif reussie dans le contexte dynamique actuellement actif. 
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(Mnemonique : ' precede souvent une chaine protegee.) Voir la remarque sur les 
performances de $' ci-dessus. 

$PROCESS_ID 
$PID 

$$ 

[GLO] Le numero de processus (PID) du Perl en train d'executer ce script. Cette 
variable est automatiquement mise a jour dans un fork. En fait, vous pouvez 
meme modifier $$ vous-meme ; ceci ne changera pas votre PID de toute facon. Ce 
serait un joli coup. (Mnemonique : comme pour les shells divers et varies). 
Vous devez faire attention de ne pas utiliser la variable $$ n'importe oil elle pour- 
rait etre malencontreusement interpretee comme une dereference : $$alphanum. 
Dans ce cas, ecrivez ${$}alphanum pour distinguer de ${$alphanum}. 

$PROGRAM_NAME 
$0 

[GLO] Contient le nom du fichier contenant le script Perl en train d'etre execute. 
L'affectation d'une valeur a $0 est magique : elle tente de modifier la zone d'argu- 
ments que voit le programme ps(l). Ceci est plus utile pour indiquer Fetat courant 
du programme que pour cacher le programme en train de tourner. Mais cela ne 
fonctionne pas sur tous les systemes. (Mnemonique : pareil que dans sh, ksh, bash, 
etc.) 

$REAL_CROUP_ID 

$CID 

$( 

[GLO] Le GID (groupe ID) reel de ce processus. Si vous vous trouvez sur une 
machine qui accepte que l'on soit membre de plusieurs groupes simultanement, $( 
donne une liste des groupes concerned, separes par des espaces. Le premier nombre 
est celui qui est renvoye par getgid(2), et les suivants par getgroups(2), Fun d'entre 
eux pouvant etre identique au premier nombre. 

De toute facon, une valeur assignee a $ ( doit etre un seul et unique nombre utilise 
pour positionner le GID. Ainsi la valeur donnee par $( ne doit pas etre reaffectee a 
$( sans la forcer a etre numerique, comme en lui ajoutant zero. Ceci parce que vous 
ne pouvez avoir qu'un seul groupe reel. Voir plutot $) ($EFFECTIVE_GROUP_ID), qui 
vous permet d'affecter plusieurs groupes effectifs. 

(Mnemonique : les parentheses sont employees pour regrouper les choses. Le GID 
reel est le groupe que vous laissez ouvert derriere vous, si votre script est lance avec 
setgid. II faut done une parenthese ouvrante.) 

$REAL_USER_ID 
$UID 

$< 

[GLO] LUID reel de ce processus tel que renvoye par l'appel systeme geteuid(2). 
Savoir si vous pouvez le changer et comment le faire est dependant de la bonne 
volonte de l'implementation sur votre systeme — voir les exemples dans $> 
($EFFECTIVE_USER_ID). (Mnemonique : il s'agit de l'UID d'oii vous provenez si votre 
script est lance avec setuid.) 
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%SIG 



[GLO] Le hachage utilise pour installer les gestionnaires de divers signaux. (Voir la 
section Signaux dans le chapitre 16, Communication inter-processus). Par exemple : 
sub gestionnaire { 

# le ler argument est le nom du signal 
"SIC$sig detecte--on quitte\n"; 

# Evitez les entrees/sorties standards dans les 

# gestionnaires asynchrones pour supprimer le 

# core dump). (Meme cette concatenation de chaine 

# est risquee) . 

# Ceci appelle une entree/sortie standard, ainsi 

# il peut y avoir quand meme un core dump ! 

# Mais puisque l'on quitte le programme, 

# il n'y a pas de mal a essayer. 

} 



my Jsig = shift; 
syswrite STDERR, 



close LOG; 



exit 1; 



$SIG{INT} = \&gestionnaire; 
$SIG{0UIT) = \&gestionnaire; 

$SIG{INT} = 'DEFAULT'; # retablir l'action par defaut 

$SIG{0UIT} = 'IGNORE'; # ignorer SIGOUIT 
Le hachage %SIG contient des valeurs indefinies correspondant aux signaux pour 
lesquels aucun gestionnaire n'a ete affecte. Un gestionnaire peut etre specifie 
comme une reference de sous-programme ou comme une chame. Une chaine dont 
la valeur n'est pas l'une des deux actions speciales « DEFAULT » ou « IGNORE » est le 
nom d'une fonction, qui, si elle n'est pas qualifiee par un paquetage, est interpretee 
comme faisant partie du paquetage main. Voici quelques exemples : 

$SIG{PIPE} = "Plombier"; # OK, on suppose qu'il s'agit de 

# main: : plombier 

$SIG{PIPE} = \&Plombier; # bien, on utilise Plombier dans 

# le paquetage courant 

Certaines routines internes peuvent egalement etre installees avec le hachage %SIG. 
La routine indiquee par $SIG{ WARN } est appelee quand un message divertisse- 
ment va etre affiche. Le message est passe en premier argument. La presence d'une 

routine WARN provoque la suppression de Faffichage normal des messages 

d'avertissements vers STDERR. Vous pouvez vous en servir pour sauvegarder ces mes- 
sages dans une variable ou pour transformer les avertissements en erreurs fatales, 
comme ceci : 

local $SIG{_WARN_} = sub { die $_[0] }; 

eval $programmette; 
C'est equivalent a : 

use warnings qw/FATAL all/; 

eval $programmette 

excepte le fait que le premier code a un contexte dynamique alors que le second a 
un contexte lexical. 

La routine indiquee par $SIG{ DIE } offre un moyen de changer une exception 

batracienne en exception princiere avec un baiser magique, ce qui souvent ne fonc- 
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tionne pas. La meilleure utilisation est l'execution de choses de derniere minute 
lorsqu'un programme est sur le point de mourir suite a une exception non inter- 
ceptee. Vous ne sauverez pas votre peau ainsi, mais vous aurez le droit de formuler 
une derniere volonte. 

Le message d'exception est passe en premier argument. Quand une routine DIE 

revient, le traitement de l'exception continue comme il l'aurait fait en l'absence de 
Finterception, a moins que la routine d'interception ne quitte elle-meme par un 

goto, une sortie de boucle ou un die. Le gestionnaire de DIE est explicitement 

desactive pendant l'appel, afin que vous puissiez vous-meme appeler alors le verita- 
ble die depuis un gestionnaire de DIE . (Si ce n'etait pas le cas, le gestionnaire 

s'appellerait lui-meme indefiniment.) Le gestionnaire pour $SIG{ WARN } pro- 
cede de la meme facon. 

Seul le programme principal doit positionner $SIG{ DIE }, pas le module. Ceci 

car actuellement, meme les exceptions qui sont interceptees continuent de declen- 

cher un gestionnaire de $SIC{ DIE }. Ceci est fortement deconseille car vous 

pourriez briser d'innocents modules qui ne s'attendaient pas a ce que les exceptions 
qu'ils prevoyaient soient alterees. Utilisez cette fonctionnalite uniquement en der- 
nier ressort, et si vous le devez, mettez toujours devant un local pour limiter la 
duree du danger. 

N'essayez pas de construire un mecanisme de gestion de signal a partir de cette 
fonctionnalite. Utilisez plutot eval {} pour intercepter les exceptions. 

STDERR 

[GLO] Le handle de fichier special pour la sortie d'erreur standard dans n'importe 
quel paquetage. 

STDIN 

[GLO] Le handle de fichier special pour l'entree standard dans n'importe quel 
paquetage. 

STDOUT 

[GLO] Le handle de fichier special pour la sortie standard dans n'importe quel 
paquetage. 

$SUBSCRIPT_SEPARATOR 
$SUBSEP 

$; 

[GLO] Le separateur d'indices pour l'emulation de hachage multidimensionnels. Si 
vous vous referez a un element de hachage comme : 

$machin{$a J $b J $c} 
cela veut vraiment dire : 

$machin{join($;, $a, $b, $c)} 
Mais ne mettez pas : 

|5)machin{$a J $b J $c} # une tranche de tableau - remarquez le @> 
qui signifie : 

($m{$a} J $machin{$b},$machin{$c}) 
La valeur par defaut est "\034", la meme que SUBSEP dans awk. Remarquez que si 
vos cles contiennent des donnees binaires, il ne peut exister de valeur sure pour $; . 
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(Mnemonique : virgule — le separateur d'indices syntaxique — est un point-vir- 
gule. Oui, je sais, c'est un peu faible, mais $, est deja prise pour quelque chose de 
plus important.) 

Bien que nous n'ayons pas decourage cette fonctionnalite, vous devez plutot envisa- 
ger d'utiliser maintenant de « veritables » hachages multidimensionnels, comme 
$machin{$a}{$b}{$c} au lieu de $machin{$a,$b,$c}. Les simulations de hachages 
multidimensionnels peuvent cependant etre plus faciles a trier et sont plus a meme 
d'utiliser les fichiers DBM. 

$SYSTEM_FD_MAX 
$ A F 

[GLO] Le descripteur de fichier « systeme » maximum, generalement 2. Les des- 
cripteurs de fichiers systemes sont passes aux nouveaux programmes durant un 
exec, alors que les descripteurs superieurs ne le sont pas. De plus, pendant un open, 
les descripteurs de fichiers systemes sont preserves meme si le open echoue. (Les 
descripteurs de fichiers ordinaires sont fermes avant que l'ouverture ne soit tentee 
et le restent si elle echoue.) Remarquez que le statut de close-on-exec d'un descrip- 
teur de fichier se decide d'apres la valeur de $ A F au moment du open, et non au 
moment du exec. Evitez ceci en affectant a $ A F une valeur qui explose les comp- 
teurs : 

{ 

local $ A F = 10000; 

pipe(SALUT, CAVA) or die "pipe a echoue : $!"; 

} 

$VERSI0N 

[PKG] Cette variable est accessible a tout moment oil une version minimale accep- 
table d'un module est specifiee, comme dans use UnModule 2.5. Si $UNM0- 
DULE: : VERSION est inferieure, une exception est levee. Techniquement, c'est la 
methode UNIVERSAL- >VERSI0N qui inspecte cette variable, vous pouvez done definir 
votre propre fonction VERSION dans le paquetage courant si vous voulez autre chose 
que le comportement par defaut. Voir le chapitre 12. 

$WARNING 

$ A W 

[GLO] La valeur booleenne courante de l'option globale d'avertissement (a ne pas 
confondre avec l'option globale d'asservissement, a propos de laquelle nous avons 
entendus de nombreux avertissements globaux). Voir aussi le pragma use war- 
nings au chapitre 31, Modules de pragma, et les options de la ligne de commande -W 
et -X pour les avertissements dans un contexte lexical, qui ne sont pas affectes par 
cette variable. (Mnemonique : la valeur est liee a l'option -w.) 

${ A WARNING_BITS} 

[NON, GLO] L'ensemble courant des tests d'avertissement actives par le pragma use 
warnings. Voir use warnings au chapitre 31 pour de plus amples details. 

${ A WIDE_SYSTEM_CALLS} 

[GLO} L'argument global qui permet a tous les appels systemes effectues par Perl 
d'utiliser les API wide-characters natives du systeme, si elles sont disponibles. II peut 
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egalement etre active depuis la ligne de commande en utilisant l'option -C. La 
valeur initiale est generallement 0 pour assurer la compatibility avec les versions de 
Perl anterieures a la 5.6, mais il peut etre automatiquement mis a 1 par Perl si le 
systeme fournit une valeur par defaut modifiable par Futilisateur (comme via 
$ENV{LC_TYPE}). Le pragma use bytes annule les effets de cet argument dans le 
contexte lexical courant. 

Et maintenant attachez vos ceintures pour un grand chapitre. . . 



29 

Fonctions 



Ce chapitre decrit les fonctions intrinseques de Perl par ordre alphabetique par souci 
pratique de reference. Chaque description de fonction commence par un bref resume 
de la syntaxe pour cette fonction. Les noms de parametre en CAPITALES OBLIQUES indi- 
quent en fait les emplacements pour des expressions ; le texte qui suit le resume de la 
syntaxe decrit ensuite la semantique de ces arguments lorsqu'on les fournit (ou qu'on 
les omet). 

Vous pouvez considerer que les fonctions sont des termes dans une expression au meme 
titre que les litteraux et les variables. Ou bien, vous pouvez considerer qu'il s'agit d'ope- 
rateurs prefixes, qui traitent les arguments qui les suivent. D'ailleurs, nous utilisons le 
mot operateur la plupart du temps. 

Certains de ces operateurs, euh, fonctions, prennent comme argument une LISTE. Les 
elements de la LISTE doivent etre separes par des virgules (ou par =>, qui est juste une 
drole de variete de virgule). Les elements de la LISTE sont evalues dans un contexte de 
liste, ainsi chaque element renvoie, soit un scalaire, soit une valeur de liste, selon sa sen- 
sibilite au contexte de liste. Chaque valeur renvoyee, que ce soit un scalaire ou une liste, 
sera interpolee comme etant un composant de la sequence entiere de valeurs scalaires. 
C'est-a-dire que les listes sont mises a plat dans une seule liste. Du point de vue de la 
fonction qui recoit les arguments, l'argument global LISTE est toujours une valeur de 
liste a une dimension. (Pour interpoler un tableau comme un element unique, vous de- 
vez explicitement creer et interpoler a la place une reference a ce tableau.) 

Les fonction predefinies de Perl peuvent etre utilisees avec ou sans parentheses enca- 
drant les arguments ; dans ce chapitre les resumes de syntaxe omettent les parentheses. 
Si vous utilisez des parentheses, la regie simple mais parfois surprenante est la suivante : 
si ca ressemble a une fonction, alors c'est une fonction, ainsi la precedence n'a pas d'im- 
portance. Sinon, il s'agit d'un operateur de liste ou d'un operateur unaire, et la prece- 



1. Parfois, les fonctions etroitement liees sont regroupees ensemble dans les pages man du sys- 
teme, nous respectons done ici cette organisation. Pour trouver par exemple la description de 
endpwent, vous devrez cherchez sous getpwent. 
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dence devient importante. Soyez vigilants, car meme si vous mettez un espace entre le 
mot-cle et sa parenthese ouvrante, cela ne l'empeche pas d'etre une fonction : 

print 1+2*4; # Affiche 9. 

print(l+2) * 4; # Affiche 3 ! 

print (l+2)*4; # Affiche aussi 3 ! 

print +(l+2)*4; # Affiche 12. 

print ((l+2)*4); # Affiche 12. 

Perl peut vous avertir de cette situation, si vous le lancez avec l'option -w. Par exemple, 
la deuxieme et la troisieme ligne ci-dessus donneront ce type de messages : 

print () interpreted as function at - line 2. 

Useless use of integer multiplication (*) in void context at - line 2. 

Avec la simple definition de certaines fonctions, vous avez une latitude considerable 
dans la maniere de passer des arguments. Par exemple, la facon la plus habituelle d'uti- 
liser chmod est de passer les permissions du fichier (le mode) comme argument initial : 

chmod 0644, ^tableau; 
mais la definition de chmod indique juste : 

chmod LISTE 

ainsi vous pouvez tout aussi bien ecrire : 

unshift ^tableau, 0644; 
chmod (^tableau; 

Si le premier argument de la liste n'est pas un mode valide, chmod echouera, mais c'est 
un probleme semantique a l'execution sans rapport avec la syntaxe de l'appel. Si la se- 
mantique reclame des arguments speciaux a donner en premier, le texte decrira ces res- 
trictions. 

Au contraire des simples fonctions de LISTE, d'autres fonctions imposent des contrain- 
tes syntaxiques supplementaires. Par exemple, push a un resume de syntaxe comme 
ceci : 

push TABLEAU, LISTE 

Cela veut dire que push demande un tableau correct comme premier argument, mais 
ne tient pas compte des arguments suivants. C'est ce que signifie le LISTE a la fin. (Les 
LISTE viennent toujours a la fin, puisqu'elles englobent toutes les valeurs qui restent). 
Si le resume de syntaxe contient des arguments avant la LISTE, ces arguments sont dis- 
tingues syntaxiquement par le compilateur, et non seulement distingues semantique- 
ment par l'interpreteur lorsqu'on le lancera plus tard. De tels arguments ne sont jamais 
evalues dans un contexte de liste. lis peuvent etre evalues soit dans un contexte scalaire, 
soit ce sont des references speciales comme le tableau dans push. (La description vous 
dira qui est qui.) 

Pour les operations qui sont directement basees sur les fonctions de la bibliotheque C, 
nous n'essayerons pas de dupliquer la documentation de votre systeme. Lorsque la des- 
cription d'une fonction demande de voir fonction(2), cela signifie que vous devez vous 
referer a la version correspondante en C de cette fonction pour en savoir plus sur sa se- 
mantique. Le nombre entre parentheses indique la section du manuel de programma- 
tion systeme dans laquelle vous trouverez la page man, si vous avez installez les pages 
man. (Et dans laquelle vous ne trouverez rien, si vous n'avez rien installe.) 
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Ces pages de manuel peuvent documenter des comportements specifiques de votre sys- 
teme, comme les mots de passe shadow, les listes de controle d'acces et ainsi de suite. De 
nombreuses fonctions Perl derivent de la bibliotheque C sous Unix mais sont emulees 
meme sur les autres plates-formes. Par exemple, meme si votre systeme d'exploitation 
ne connait pas les appels systeme flock(2) et fork(2), Perl fait de son mieux pour les emu- 
ler avec les ressources natives de votre plate-forme. 

Parfois, vous constaterez que, dans la documentation, la fonction C recoit plus d'argu- 
ments que la fonction Perl correspondante. En general, les arguments supplementaires 
sont deja connus par Perl, comme la longueur d'un autre argument. Les autres differen- 
ces viennent de la facon dont Perl et C specifient les handles de fichiers, ainsi que les 
valeurs de succes et d'echec. 

En general, les fonctions en Perl qui servent de sur-couches aux appels systeme du 
meme nom (comme chown(2),fork(2), closedir(2), etc.) renvoient toutes une valeur vraie 
lorsqu'elle reussissent, sinon undef comme indique dans les descriptions qui suivent. 
Ceci est different des interfaces C a ces operations, lesquelles retournent toutes -1 en cas 
d'echec. Les exceptions a cette regie sont wait, waitpid et syscall. Les appels systeme 
positionnent aussi la variable speciale $! ($0S_ERR0R). Les autres fonctions ne le font 
pas, excepte accidentellement. 

Pour les fonctions qui peuvent etre utilisees aussi bien dans un contexte scalaire que 
dans un contexte de liste, un echec est generalement indique dans un contexte scalaire 
en retournant une valeur fausse (en general undef) et dans un contexte de liste en re- 
tournant une liste vide. La reussite de l'operation est generalement indiquee en ren- 
voyant une valeur qui sera evaluee comme vraie (dans le contexte). 

Retenez la regie suivante : il n'y a pas de regie qui relie le comportement d'une fonction 
dans un contexte de liste a son comportement dans un contexte scalaire, ou vice versa. 
II peut s'agir de deux choses totalement differentes. 

Chaque fonction connait le contexte dans lequel elle a ete appelee. La meme fonction, 
qui renvoie une liste lorsqu'on l'appelle dans un contexte de liste, retournera, lorsqu'on 
l'appelle dans un contexte scalaire, la valeur qui lui semble la plus appropriee. Certaines 
fonctions renvoient la longueur de la liste qui aurait ete retournee dans un contexte de 
liste. D'autres fonctions retourne « l'autre » valeur, lorsque quelque chose peut etre ma- 
nipule, soit par un nombre, soit par son nom. D'autres encore renvoient un compteur 
des operations qui ont reussi. En general, les fonctions de Perl font exactement ce que 
vous voulez faire, a moins que vous ne vouliez de la coherence. 

Une derniere remarque : nous avons essaye d'etre tres coherents dans notre emploi des 
termes octets et caracteres. Historiquement, ces termes ont ete confondus Fun avec 
l'autre (et avec eux-memes). Mais lorsque nous disons octet, nous designons toujours 
un octet de 8 bits. Lorsque nous disons caractere, nous voulons dire un caractere dans 
son abstraction, generalement un caractere Unicode, lequel peut etre represents dans 
vos chaines par un ou plusieurs octets. 

Mais notez que nous avons dit « generalement ». Perl confond a dessein les octets avec 
les caracteres dans le contexte d'une declaration use bytes, ainsi a chaque fois que nous 
parlons de caractere, vous devez comprendre un octet dans un contexte use bytes, si- 
non un caractere Unicode. En d'autres termes, use bytes reprend la definition d'un ca- 
ractere telle qu'on la concevait dans les precedentes versions de Perl. Ainsi, par exemple, 
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si nous disons qu'un reverse scalaire, inverse une chaine caractere par caractere, ne 
nous demandez pas si cela veut vraiment dire caracteres ou alors octets, car la reponse 
est : « Oui ». 

Fonctions Perl par categorie 

Voici les fonctions de Perl et les mots-cles assimiles, classes par categorie. Certaines fonc- 
tions apparaissent sous plusieurs en-tetes. 

Manipulation de scalaires 

chomp, chop, chr, crypt, hex, index, lc, lcfirst, length, oct, ord, pack, q//, qq/7, 
reverse, rindex, sprintf, substr, tr///, uc, ucf irst, y/// 

Expressions rationnelles et recherche de motifs 

m/7, pos, qr/7, quotemeta, s///, split, study 
Fonctions numeriques 

abs, atan2, cos, exp, hex, int, log, oct, rand, sin, sqrt, srand 
Traitement des tableaux 

pop, push, shift, splice, unshift 
Traitement des listes 

grep, join, map, qw//, reverse, sort, unpack 
Traitement des hachages 

delete, each, exists, keys, values 
Entrees et sorties 

binmode, close, closedir, dbmclose, dbmopen, die, eof, fileno, flock, format, 
getc, print, printf, read, readdir, readpipe, rewinddir, seek, seekdir, select 
(descripteurs de fichiers prets), syscall, sysread, sysseek, syswrite, tell, tell- 
dir, truncate, warn, write 

Donnees et enregistrements de longueur fixe 

pack, read, syscall, sysread, sysseek, syswrite, unpack, vec 

Handles de fichiers, fichiers et repertoires 

chdir, chmod, chown, chroot, f cntl, glob, ioctl, link, lstat, mkdir, open, opendir, 
readlink, rename, rmdir, select (descripteurs de fichiers prets), select (handle du 
fichier de sortie), stat, symlink, sysopen, umask, unlink, utime 

Controle deflux des programmes 

caller, continue, die, do, dump, eval, exit, goto, last, next, redo, return, sub, 
wantarray 

Portee 

caller, import, local, my, no, our, package, use 

Divers 

defined, dump, eval, formline, lock, prototype, reset, scalar, undef, wantarray 
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Processus etgroupes de processus 

alarm, exec, fork, getpgrp, getppid, getpriority, kill, pipe,qx//, setpgrp, set- 
priority, sleep, system, times, wait, waitpid 

Modules de bibliotheques 

do, import, no, package, require, use 

Classes et objets 

bless, dbmclose, dbmopen, package, ref, tie, tied, untie, use 

Acces aux sockets de bas niveau 

accept, bind, connect, getpeername, getsockname, getsockopt, listen, recv, send, 
setsockopt, shutdown, socket, socketpair 

Communications inter-processus System V 

msgctl, msgget, msgrcv, msgsnd, semctl, semget, semop, shmctl, shmget, shmread, 
shmwrite 

Recherches d'informations sur les groupes et les utilisateurs 

endgrent, endhostent, endnetent, endpwent, getgrent, getgrgid, getgrnam, get- 
login, getpwent, getpwnam, getpwuid, setgrent, setpwent 

Recherches d'informations reseaux 

endprotoent, endservent, gethostbyaddr, gethostbyname, gethostent, 
getnetbyaddr, getnetbyname, getnetent, getprotobyname, getprotobynumber, get- 
protoent, getservbyname, getservbyport, getservent, sethostent, setnetent, 
setprotoent, setservent 

Date et heure 

gmtime, localtime, time, times 

Fonctions Perl par ordre alphabetique 

La plupart des fonctions suivantes sont annotees avec, euh, des annotations. Voici leur 
signification : 

12 Utilise $_ ($ARG) comme variable par defaut. 

[$[J Modifie $! ($0S_ERR0R) pour les erreurs dans les appels systeme. 

[$5 Leve des exceptions ; utilisez eval pour intercepter $@ ($EVAL_ERROR). 

[$?| Modifie $? ($CHILD_ERROR) lorsque le processus fils se termine. 

IjfJ Marque la donnee retournee. 

|T| Marque la donnee retournee dans certains systemes, localement, ou configured 
manuellement. 

H Leve une exception si un argument d'un type inapproprie est donne. 
[X] Leve une exception si on modifie une cible en lecture seule. 



648 



Chapitre 29 — Fonctions 



\T\ Leve une exception si on l'alimente avec une donnee marquee. 

|T| Leve une exception s'il n'existe pas d'implementation sur la plate-forme courante. 

Les fonctions qui retournent une donnee marquee lorsqu'elles sont alimentees avec une 
donnee marquee ne sont elles-memes pas marquees, puisque c'est le cas de la plupart 
des fonctions. En particulier, si vous utilisez n'importe quelle fonction avec %ENV ou 
@ARGY vous obtiendrez une donnee marquee. 

Les fonctions annotees avec @ levent une exception lorsqu'elles attendent, mais ne re- 
coivent pas, un argument d'un type precis (comme des handles de fichiers pour les ope- 
rations d'entree/sortie, des references pour bless, etc.). 

Les fonctions annotees avec [|T] ont parfois besoin de modifier leurs arguments. Si elles 
ne peuvent pas modifier l'argument car il est marque en lecture seule, elles levent une 
exception. Des exemples de variables en lecture seule sont les variables speciales conte- 
nant une donnee capturee durant une recherche de motif et les variables qui sont en 
fait des alias de constantes. 

Les fonctions annotees avec \J] peuvent ne pas etre implementees sur toutes les plates- 
formes. Bien que la plupart d'entre elles soient nominees d'apres les fonctions de la bi- 
bliotheque C sous Unix, ne croyez pas que vous ne pouvez en appeler aucune, seule- 
ment parce que vous n'etes pas sous Unix. Beaucoup sont emulees, meme celles que 
vous n'esperiez jamais voir — comme fork sur les systemes Win32, qui est en place de- 
puis la version 5.6 de Perl. Pour plus d'informations sur la portability et le comporte- 
ment de fonctions specifiques a un systeme, voir la page de man perlport, plus quelques 
documentations specifiques a la plate-forme fournie par votre portage de Perl. 

Les fonctions qui levent d'autres exceptions diverses et variees sont annotees avec [$§, y 
compris les fonctions mathematiques qui emettent des erreurs d'intervalle, comme 



abs VALEUR 
abs 

Cette fonction renvoie la valeur absolue de son argument. 

$diff = abs($premier - $second); 

Remarque : ici et dans les exemples suivants, un bon style (et le pragma use strict) 
exigerait que vous ajoutiez un modificateur my pour declarer une nouvelle variable de 
portee lexicale, comme ceci : 

my $diff = abs($premier - $second); 

Toutefois, nous avons omis my de la plupart de nos exemples pour plus de clarte. Vous 
n'avez qu'a supposer qu'une telle variable a ete declaree plus tot, si cela vous demange. 



sqrt(-l). 



abs 



accept 



m @ lh 



accept SOCKET, SOCKET PROTO 
Cette fonction est utilisee par les processus serveurs qui desirent se mettre en attente de 
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connexion de clients sur une socket. SOCKET_PROTO doit etre un handle de fichier deja 
ouvert via Foperateur socket et attache a l'une des adresses reseau du serveur ou a 
INADDR_ANY. L'execution est suspendue jusqu'a ce qu'une connexion soit etablie, un han- 
dle de fichier SOCKET etant alors ouvert et attache a la nouvelle connexion. Le handle 
original SOCKET_PROTO reste inchange ; son seul but est d'etre clone dans une veritable 
socket. La fonction renvoie Fadresse de la connexion si l'appel reussit, une valeur fausse 
sinon. Par exemple : 

unless ($interlocuteur = accept(SOCK, S0CKPR0T0)) { 
die "Ne peut accepter la connexion : $!\n"; 

} 

Sur les systemes qui Facceptent, le flag close-on-exec sera positionne pour le nouveau 
descripteur de fichier ouvert, comme le veut la valeur de $ A F ($SYSTEM_FD_MAX). 

Voir accept{2). Voir aussi l'exemple dans la section Sockets au chapitre 16, Communication 
interprocessus. 

alarm B GO 

alarm EXPR 
alarm 

Cette fonction envoie un signal SICALRM au processus courant apres EXPR secondes. 

Un seul minuteur (timer) peut etre actif a un moment donne. Chaque appel desactive 
le precedent minuteur et un argument EXPR valant 0 peut etre fourni pour annuler le 
minuteur precedent sans en lancer un de nouveau. 

print "Repondez en une minute ou allez en enter : 

alarm(60); # tue le programme dans une minute 

$reponse = <STDIN>; 

$temps_restant = alarm(o) # efface l'alarme 
print "II vous reste $temps_restant secondes\n"; 

Une erreur courante est de melanger les appels a alarm et sleep, car nombre de syste- 
mes utilisent le mecanisme de l'appel systeme a alarm(2) pour implementer sleep(3). 
Sur des machines plus anciennes, le temps ecoule peut etre jusqu'a une seconde infe- 
rieur a celui que vous avez specifie, selon la maniere dont sont comptees les secondes. 
De plus, un systeme surcharge peut ne pas etre pret a lancer votre processus immedia- 
tement. Voir le chapitre 16 pour plus d' informations sur Finterception de signaux. 

Pour des alarmes d'une granularite plus fine que la seconde, vous pouvez utiliser la 
fonction syscall pour acceder a setitimer(2) si votre systeme le supporte. Le module 
CPAN, Timer: :HiRes offre aussi des fonctions dans cet objectif. 

atan2 

atan2 Y, X 

Cette fonction renvoie la valeur principale de Farctangente de Y/X dans Fintervalle 
de -it a jt. Une moyen rapide d'obtenir une valeur approchee de it est d'ecrire : 

$pi = atan2(l, l) * A; 



650 



Chapitre 29 — Fonctions 



Pour la tangente, vous pouvez utiliser la fonction tan provenant soit du module 
Math: :Trig, soit du module POSIX, ou employer la relation bien connue : 

sub tan { sin($_[o] / cos($_[o]) } 

bind h @ DO S 

bind SOCKET, NOM 

Cette fonction attache une adresse (un nom) a une socket deja ouverte, specifiee par le 
handle de fichier SOCKET. La fonction renvoie vrai si elle a reussi, sinon faux. NOM doit 
etre une adresse empaquetee de la socket avec le type approprie. 

use Socket; 

$numero_port = 80; # pretend que nous voulons etre un serveur web 

$adresse_socket = sockaddr_in($numero_port, INADDR_ANY); 
bind SOCK, $adresse_socket 

or die "Impossible d'attacher $numero_port : $!\n"; 
Voir bind(2). Voir aussi les exemples de la section Sockets au chapitre 16. 

binmode @ 

binmode HANDL EFICHIER, DISCIPLINES 
binmode HANDL EFICHIER 

Cette fonction s'arrange pour que le HANDLE_FICHIER ait la semantique specifiee par l'ar- 
gument DISCIPLINES. Si Ton omet DISCIPLINES, des semantiques binaires (ou « raw ») 
sont appliquees au handle de fichier. Si HANDLE_FICHIER est une expression, la valeur est 
prise de maniere appropriee, comme le nom du handle de fichier ou comme une refe- 
rence a un handle de fichier. 

La fonction binmode doit etre appelee apres l'open mais avant qu'une quelconque ope- 
ration d'entree/sortie sur le handle de fichier n'ait ete effectuee. Le seul moyen de reini- 
tialiser le mode d'un handle de fichier est de rouvrir le fichier, puisque les diverses 
disciplines ont pu conserver divers bits et segments de donnees dans diverses memoires 
tampons. Cette restriction est susceptible d'etre levee a l'avenir. 

Autrefois, binmode etait principalement utilise sur les systemes d'exploitation dont les 
bibliotheques d'execution distinguaient les fichiers textes des fichiers binaires. Sur ces 
systemes, l'objectif de binmode etait de desactiver la semantique de texte par defaut. De 
toute facon, depuis l'avenement d'Unicode, tous les programmes sur tous les systemes 
doivent connaitre la distinction, meme sur les systemes Unix ou Mac. De nos jours, il 
n'existe qu'un type de fichiers binaire (du moins pour Perl), mais une multitude de ty- 
pes de fichiers texte. Ainsi, Perl ne connait qu'un seul format interne pour les textes 
Unicode, UTF-8. Puisqu'il existe une variete de fichiers texte, ceux-ci doivent souvent 
etre convertis en entree vers UTF-8 et en sortie vers le jeu de caractere d'origine ou vers 
une autre representation d'Unicode. Vous pouvez utiliser les disciplines pour indiquer 
a Perl comment realiser exactement (ou inexactement) ces conversions. 2 



2. Plus precisement, vous serez capable d'employer les disciplines pour ceci, mais nous n'avons 
pas acheve leur implementation au moment ou ces lignes sont ecrites. 
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Par exemple, une discipline de " :text" dira a Perl de traiter les textes de facon generi- 
que sans preciser quel type de texte traiter. Mais des disciplines comme ":utf8" ou 
" : latinl" disent a Perl quel format de texte lire et ecrire. D'un autre cote, la discipline 
" : raw" previent Perl de garder ses sales mains en dehors des donnees. Pour en savoir 
plus sur le fonctionnement (eventuellement futur) des disciplines, voir la fonction open. 
La suite de cette discussion decrit ce que binmode fait sans l'argument DISCIPLINES, c'est- 
a-dire la signification historique de binmode, qui est equivalente a : 

binmode HANDL EFICHIER, ":raw"; 

Sauf indication contraire, Perl suppose que votre fichier fraichement ouvert doit etre lu 
ou ecrit en mode texte. Le mode texte signifie que \n (newline) est votre caractere fin 
de ligne interne. Tous les systemes utilisent \n comme leur caractere de fin de ligne in- 
terne mais ce qu'il represente reellement varie d'un systeme a l'autre, d'un peripherique 
a un autre et meme d'un fichier a un autre, selon la facon dont vous acceder au fichier. 
Sur de tels systemes (comprenant MS-DOS et VMS), ce que votre programme voit com- 
me un \n peut ne pas etre ce qui est stocke physiquement sur le disque. Le systeme d'ex- 
ploitation peut, par exemple, stocker des fichiers textes avec les sequences \cM\c3 qui 
sont converties en entree pour apparaitre comme \n dans votre programme et inverse- 
ment convertir \n depuis votre programme vers \cM\cD en sortie dans un fichier. La 
fonction binmode desactive cette conversion automatique sur de tels systemes. 

En l'absence d'un argument DISCIPLINES, binmode n'a aucun effet sous Unix ou MAC 
OS, tous deux utilisant \n pour terminer chaque fin de ligne et representant ceci avec 
un seul caractere. (II peut s'agir toutefois d'une autre caractere : Unix utilise \cl et les 
anciens Macs \cM. Mais cela ne porte pas a consequence.) 

Les exemples suivants montrent comment un script Perl doit lire une image GIF depuis 
un fichier et l'afficher sur la sortie standard. Sur les systemes qui autrement altereraient 
les donnees litterales en quelque chose d'autre que leur exacte representation physique, 
vous devez preparer les deux handles de fichiers. Alors que vous pourriez directement 
utiliser une discipline " :raw" pour ouvrir le fichier GIF, vous ne pouvez pas si facile- 
ment faire de meme avec les handles de fichiers deja ouverts, tels que STDOUT : 

binmode STDOUT; 

open(GIFj "vim-power. gif") or die "Impossible d'ouvrir vim-power .gif : 
$!\n"; 

binmode GIF; 

while (read(GIF J $buf, 1024)) { 
print STDOUT $buf; 

} 



bless @ 

bless REF, N0M_DE_CLASSE 
bless REF 

Cette fonction indique a l'objet sur lequel pointe REF qu'il est maintenant un objet du 
paquetage N0M_DE_CLASSE — ou du paquetage courant si aucun N0M_DE_CLASSE n'est 
specifie. Si REF n'est pas une reference valide, une exception est levee. Pour des raisons 
pratiques, bless retourne la reference, puisque c'est souvent la derniere fonction d'un 
constructeur. Par exemple : 
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$dromadaire = Animal->nouveau(TYPE => "Chameau", NOM => "amelia"); 

# puis dans Amimal.pm : 
sub nouveau { 

my $classe = shift; 

my %attrs = @_; 

my $obj = { %attrs }; 

return bless($obj, $classe); 

} 

Vous devez generalement consacrer les objets avec bless dans des NOMS_DE_CLASSE en 
majuscules et minuscules melangees. Les espaces de noms tout entiers en minuscules 
sont reserve pour des besoins internes, comme les pragmas (directives de compilation) 
de Perl. Les types predefinis (tels que « SCALAR », « ARRAY », « HASH », etc., pour 
ne pas mentionner la classe de base de toutes les classes, « UNIVERSAL ») sont tous en 
majuscules, alors peut-etre vaut-il mieux que vous evitiez des noms de paquetages ecrits 
ainsi. 

Assurez-vous que NOM_DE_CLASSE ne soit pas a une valeur fausse, la consecration dans 
des paquetages faux n'est pas supportee et peut conduire a des resultats imprevisibles. 

Ce n'est pas un bug qu'il n'y ait pas d'operateur curse correspondant. (Mais il existe un 
operateur sin, jeu de mot intraduisible, l'operateur sin s'occupant de la fonction sinus 
et non d'un quelconque blaspheme.) Voir aussi le chapitre 12, Objet, pour en savoir plus 
sur la benediction (et les consecrations) des objets. 

caller 

caller EXPR 
caller 

Cette fonction renvoie des informations concernant la pile d'appels en cours de sous- 
programmes et assimiles. Sans argument, elle renvoie le nom du paquetage, le nom du 
fichier et le numero de ligne d'oii la routine en cours d'execution a ete appelee : 

($paquetage, $fichier, $ligne) = caller; 

Voici un exemple d'une fonction extremement fastidieuse, qui utilise les tokens spe- 
ciaux PACKAGE et FILE decrit au chapitre 2, Composants de Perl : 

sub attention { 

my ($paquetage, $fichier) = caller; 

unless ($paquetage eq _PACKAGE_ && $file eq FILE ) { 

die "Vous n'etes pas suppose m'appeller, $paquetage !\n"; 

} 

print "Appelez-moi en toute tranquilliteAn"; 

} 

sub appel_tranquille { 
attentionQ; 

} 

Appelee avec un argument, caller interprete EXPR comme etant le nombre de groupes 
d'elements dans la pile (stack frames) a remonter avant la routine courante. Par exemple, 
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un argument de 0 signifie l'element courant dans la pile ; 1, la routine appelante ; 2, la 
routine appelante de la routine appelante ; et ainsi de suite. La fonction renvoie egale- 
ment des informations supplementaires, comme le montre Fexemple suivant : 

$i = 0; 

while (($paquetage, $fichier, $ligne, $routine, 

$args_presents, $tableau_demande, $texte_eval, $est_requis, 
$indications, $masque_de_bits) = caller($i++)) 

{ 
} 

Si l'element est un appel de sous-programme, $args_presents est vrai s'il possede son 
propre tableau @_ (et non un qui soit emprunte a la routine qui Fa appele). Sinon, $rou- 
tine peut valoir "(eval)" si l'element n'est pas un appel de sous-programme mais un 
eval. Si c'est le cas, les informations supplementaires $texte_eval et $est_requis sont 
positionnees : $est_requis est vrai si l'element est cree par une instruction require ou 
un use, et $texte_eval contient le texte de l'instruction eval EXPR. Plus particuliere- 
ment, pour une instruction eval BLOCK, $f ichier vaut "(eval)", mais $texte_eval est 
indefini. (Remarquez egalement que chaque instruction use cree un element require 
dans un element eval EXPR.) $indications et $masque_de_bits sont des valeurs inter- 
nes ; vous etes pries de les ignorer a moins que vous ne soyez membre de la thaumato- 
cratie. 

Dans un esprit de magie encore plus poussee, caller positionne egalement le tableau 
@DB : : args avec les arguments passe a l'element donne de la pile — mais seulement lors- 
qu'on l'appelle depuis le paquetage DB. Voir le chapitre 20, Le debogueur Perl. 



chdir go m 

chdir EXPR 
chdir 

Cette fonction change le repertoire de travail du processus courant en EXPR, si cela est 
possible. Si EXPR est omise, on utilise le repertoire de base de l'utilisateur. La fonction 
renvoie vraie si elle reussit, sinon faux. 

chdir "$prefixe/lib" or die "Impossible de faire un cd dans $prefixe/lib\n"; 

Voir aussi le module Cwd, decrit au chapitre 32, Modules standard, qui vous permet de 
garder automatiquement une trace de votre repertoire courant. 



chmod n m 

chmod LISTE 

Cette fonction modifie les permissions d'une liste de fichiers. Le premier element de la 
liste doit etre le mode numerique, comme dans l'appel systeme chmod(2). La fonction 
renvoie le nombre de fichiers modifies avec succes. Par exemple : 

$compt = chmod 0755, 'fichierl-", , fichier2 , j 

affectera 0, 1 ou 2 a $compt, selon le nombre de fichiers modifies. L'operation est jugee 
reussie par l'absence d'erreur et non par un veritable changement, car un fichier peut 
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avoir le meme mode qu'avant l'operation. Une erreur signifie vraisemblablement que 
vous manquez de privileges suffisants pour changer le mode du fichier car vous n'etes 
ni son proprietaire, ni le super-utilisateur. Verifiez $ ! pour decouvrir la cause reelle de 
Fechec. 

Voici une utilisation plus typique : 

chmod(0755, @executables) == @executables 

or die "Modification impossible de certains elements de @executables : $!"; 

Si vous devez connaitre quels fichiers n'ont pas pu etre changes, ecrivez quelque chose 
comme ceci : 

@immuables = grep {not chmod 0755, $_} J fichierl J , J fichier2', 'fichier3'; 
die "$0 : impossible d'executer chmod @immuables\n" if @immuables; 

Cet idiome utilise la fonction grep pour ne selectionner que les elements de la liste pour 
lesquels la fonction chmod a echoue. 

Lorsque des donnees non litterales sont utilisees pour le mode, vous pouvez avoir be- 
som de convertir une chaine octale en un nombre decimal en utilisant la fonction oct. 
Ceci car Perl ne devine pas automatiquement qu'une chame contient un nombre octal 
seulement parce qu'elle commence par un « 0 ». 

$M0DE_DEFAUT = 0644; # On ne peut pas utiliser de guillemets ici ! 
PROMPT: { 

print "Nouveau mode ? "; 
$chaine_mode = <STDIN>; 

exit unless defined $chaine_mode; # test de fin de fichier 
if ($chaine_mode =~ / A \s*$/ { # test de ligne a blanc 

$mode = $MODE_DEFAUT; 

} 

elsif ($chaine_mode !~ / A \d+$/) { 

print "Demande un mode numerique, $chaine_mode invalide\n"; 
redo PROMPT; 

} 

else { 

$mode = oct($chaine_mode); # convertit "755" en 0755 

} 

chmod $modej @fichiers; 

} 

Cette fonction marche avec des modes numeriques comme dans l'appel systeme Unix 
chmod(2). Si vous voulez une interface symbolique comme celle fournie par la comman- 
de chmod(l), voir le module File : : chmod de CPAN. 

Vous pouvez aussi importer les constantes symboliques S_I* du module Fcntl : 
use Fcntl 'imode-"; 

chmod S_IRWXU|S_IRGRP|S_IXGRP|S_IROTH|S_IXOTH, (ffiexecutables; 

Certains considerent que ceci est plus lisible qu'avec 0755- Maintenant, c'est a vous de 
voir. 
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chomp 



chomp VARIABLE 
chomp LISTE 
chomp 

Cette fonction supprime (normalement) un saut de ligne a la fin d'une chaine contenue 
dans une variable. II s'agit d'une fonction legerement plus sure que chop (decrite ci-des- 
sous) en ce qu'elle n'a pas d'effet sur une chaine ne se terminant pas par un saut de ligne. 
Plus precisement, elle supprime la fin d'une chaine correspondant a la valeur courante 
de $/, et non n'importe quel caractere de fin. 

A l'inverse de chop, chomp renvoie le nombre de caracteres supprimes. Si $/ vaut " " (en 
mode paragraphe), chomp enleve tous les caracteres de fin de ligne a la fin de la chaine 
selectionnee (ou des chaines si Ton « chompe » une LISTE). Vous ne pouvez pas 
« chomper » un litteral, seulement une variable. 

Par exemple : 

while (<PASSWD>) { 

chomp; # evite d'avoir \n dans le dernier champ 
^tableau = split /:/; 



Avec la version 5.6, la signification de chomp change legerement en ce que les disciplines 
en entree peuvent prendre le dessus sur la valeur de la variable $/ et affecter la maniere 
dont les chaines doivent etre « chompees ». Ceci a l'avantage qu'une discipline en en- 
tree peut reconnaitre plus d'une variete de delimiteur de ligne (comme un paragraphe 
Unicode et les separateurs de ligne), mais « chompe » encore en toute securite tout ce 
qui termine la ligne courante. 



chop VARIABLE 
chop LISTE 
chop 

Cette fonction coupe le dernier caractere d'une chaine et renvoie le caractere coupe. 
L'operateur chop est utilise en premier lieu pour couper le caractere fin de ligne a la fin 
d'un enregistrement en entree, mais est plus efficace qu'une substitution. Si c'est tout 
ce que vous en faites, alors il est plus star d'utiliser chomp, puisque chop tronque toujours 
la chaine d'un caractere quel qu'il soit, alors que chomp est plus selectif. 

Vous ne pouvez pas « choper » un litteral, seulement une variable. 

Si vous « chopez » une LISTE de variables, chacune des chaines de la liste est coupee : 

@lignes = 'cat mon_fichier'; 
chop @lignes; 

Vous pouvez « choper » tout ce qui est une lvalue, y compris une affectation : 

chop($rep_courant = 'pwd'); 
chop($reponse = <STDIN>); 



} 
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Ce qui est different de : 

$reponse = chop($tmp = <STDIN>); # MAUVAIS 

qui met un caractere fin de ligne dans $reponse puisque chop renvoie le caractere elimi- 
ne et non la chaine resultante (qui se trouve dans $tmp). Une maniere d'obtenir le re- 
sultat voulu est d'utiliser substr : 

$reponse = substr <STDIN>, 0, -l; 
Mais on l'ecrit plus frequemment : 

chop($reponse = <STDIN>); 
La plupart du temps, on peut exprimer chop en termes de substr : 

$dernier_caractere = chop($var); 

$dernier_caractere = substr($var, -1, 1, ""); # la meme chose 

Une fois que vous aurez compris cette equivalence, vous pourrez l'utiliser pour faire des 
coupes plus evoluees. Pour couper plus d'un caractere, utilisez substr comme une lva- 
lue, en assignant une chaine vide. Ce qui suit enleve les cinq derniers caracteres de $ca- 
ravane : 

substr($caravane, -5) = ""; 

Le parametre negatif fait partir substr de la fin de la chaine au lieu du debut. Si vous 
voulez recuperer les caracteres ainsi enleves, vous pouvez employer la forme a quatre 
arguments de substr, creant ainsi quelque chose comme un quintuple « chop » : 

$queue = substr($caravane, -5, 5, ""); 

chown a m s 

chown LISTE 

Cette fonction change le proprietaire et le groupe d'une liste de fichiers. Les deux pre- 
miers elements de la liste doivent etre les UID et GID numeriques, dans cet ordre. Une 
valeur de - 1, dans Fune ou l'autre position, est interpretee par la plupart des systemes 
en conservant la valeur inchangee. La fonction renvoie le nombre de fichiers modifies 
avec succes. Par exemple : 

($compt = chown ($uidnum, $gidnum, 'i ichierl-" , 'fichier2')) == 2 
or die "chown impossible pour fichierl ou fichier2 : $!"; 

mettra $compt a 0, 1 ou 2, selon le nombre de fichiers modifies (dans le sens ou l'opera- 
tion s'est deroulee avec succes, et non selon que le proprietaire est different apres coup). 
Voici une utilisation plus typique : 

chown ($uidnum, $gidnum, @fichiers) == @fichiers 

or die "Modification impossible de (Sfichiers avec chown : $!"; 

Voila un sous-programme qui accepte un nom d'utilisateur, verifie les UID et GID pour 
vous, puis effectue le chown : 

sub chown_avec_le_nom { 

my ($utilisateur, (Sfichiers) = @>_; 

chown((getpwnam($utilisateur)) [2,3], (Sfichiers) == (Sfichiers 
or die "chown impossible pour @fichiers : $!"; 
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} 



chown_avec_le_nom("larry", glob("*.c")); 

Cependant, il se peut que vous ne vouliez pas modifier le groupe ainsi que le fait la fonc- 
tion precedente, car le fichier /etc/passw d associe a chaque utilisateur, un groupe unique 
meme si cet utilisateur peut etre membre de plusieurs groupes secondaires dans 
/etc/groups. Dans ce cas, vous pouvez passer -1 pour le GID, ce qui laisse inchange le 
groupe du fichier. Si vous passez -1 comme UID et un GID valide, vous pouvez affecter 
le groupe sans changer l'utilisateur. 

Sur la plupart des systemes, vous n'avez la permission de changer le proprietaire du fi- 
chier que si vous etes le super-utilisateur, bien que vous puissiez changer le groupe en 
n'importe lequel de vos groupes secondaires. Sur des systemes peu surs, ces restrictions 
peuvent etre assouplies, mais cette supposition n'est pas generalisable. Sur les systemes 
POSIX, vous pouvez detecter quelle regie s'applique ainsi : 

use POSIX qw(sysconf _PC_CHOWN_RESTRICTED); 

# essayez seulement si vous etes le super-utilisateur 

# ou sur un systeme permissif 

if ($> == 0 | | !sysconf(_PC_CHOWN_RESTRICTED)) { 
chown($uidnum, -1, $fichier) 

or die "chown de $fichier a $uidnum impossible : $!"; 



chr NOMBRE 
chr 

Cette fonction renvoie le caractere represente par ce NOMBRE dans le jeu de caracteres. Par 
exemple, chr(65) vaut « A » en ASCII comme en Unicode, et chr(Ox263a) est un smi- 
ley Unicode. Pour obtenir l'inverse de chr, utilisez ord. 

Si vous preferez specifier votre caractere par son nom plutot que par un nombre (par 
exemple, "\N{WHITE SMILING FACE}" pour un smiley Unicode), voir charname au cha- 
pitre 31, Modules de pragmas. 



chroot FICHIER 
chroot 

En cas de succes, FICHIER devient le nouveau repertoire racine pour le processus cou- 
rant, le point de depart des noms de chemin commencant par « / ». Ce repertoire est 
herite par appels a exec et par tous les sous-processus forkes apres l'appel a chroot. Il 
n'y a aucun moyen de revenir a Fetat precedent un chroot. Pour des raisons de securite, 
seul le super-utilisateur peut utiliser cette fonction. Voici un morceau de code ressem- 
blant approximativement a ce que font de nombreux serveurs FTP : 

chroot ( (getpwnam ( ' f t p ' ) ) [ 7 ] 

or die "Ftp anonyme impossible : $!\n"; 

Il est improbable que cette fonction marche sur des systemes non-Unix. Voir chroot(2). 



chr 



chroot 



B@mm 
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close a @ a 

close HANDLE 
close 

Cette fonction ferme le fichier, la socket ou le pipe associe au HANDLE. (Elle ferme le han- 
dle de fichier actuellement selectionne si l'argument est omis.) Elle renvoie vrai si la fer- 
meture se deroule avec succes, sinon faux. Vous n'avez pas besoin de fermer HANDLE si 
vous le rouvrez immediatement, puisque le open suivant le ferme automatiquement 
pour vous. (Voir open.) Cependant, un close explicite sur un fichier en entree remet a 
zero le compteur de lignes ($. ), ce qui n'est pas le cas de la fermeture implicite effectuee 
par open. 

HANDLE peut etre une expression dont la valeur peut etre employee en tant que handle 
de fichier indirect (soit le non reel du handle de fichier, soit une reference a tout ce qui 
peut etre interprets comme un objet handle de fichier.) 

Si le handle de fichier vient d'une ouverture de pipe, close renverra faux si un appel 
systeme sous-jacent echoue ou si le programme a Fautre extremite du pipe se termine 
avec un statut non nul. Dans ce dernier cas, le close force la variable $! ($0S_ERR0R) a 
zero. Done, si un close sur un pipe renvoie un statut non nul, verifiez $ ! pour determi- 
ner si le probleme vient du pipe lui-meme (valeur non nulle) ou du programme a 
Fautre bout du pipe (valeur nulle). Dans tous les cas, $? ($CHILD_ERROR) contient la va- 
leur de statut d'attente (NAT. : wait status ; voir son interpretation a la fonction system) 
de la commande associee a Fautre extremite du pipe. Par exemple : 

open(SORTIEj '| sort -rn | lpr -p') # pipe pour sort et lpr 

or die "Impossible de demarrer le pipe sortlpr : $!"; 
print SORTIE @lignes; # imprime des choses sur la sortie 

close SORTIE # attend que le sort finisse 

or warn $! ? "Erreur systeme lors de la fermeture du pipe sortlpr : $!" 
: "Statut d'attente du pipe sortlpr $?"; 

Un handle de fichier produit, en dup(2)liquant un pipe, est traite comme un handle de 
fichier ordinaire, ainsi close n'attendra pas le fils pour ce handle de fichier. Vous devez 
attendre le fils en fermant le handle de fichier d'origine. Par exemple : 

open(NESTSTAT, "netstat -rn |") 

or die "Impossible de lancer netstat : $!"; 
open (STDIN, "<&NETSTAT") 

or die "Impossible de dupliquer vers stdin : $!"; 

Si vous fermez le STDIN ci-dessus, il n'y aura pas d'attente ; par contre, il y en aura si vous 
fermez NETSTAT. 

Si vous vous debrouillez d'une maniere ou d'une autre pour recolter vous-meme un 
pipe fils qui s'est termine, le close echouera. Ceci peut arriver si vous avez votre propre 
gestionnaire pour $SIG{CHLD} qui se declenche lorsque le pipe fils se termine, ou si vous 
appelez intentionnellement waitpid avec Fidentifiant de processus renvoye par l'appel 
de open. 
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closedir @ @ DO 

closedir HANDLE_REP 

Cette fonction ferme un repertoire ouvert par opendir et renvoie la reussite de Fopera- 
tion. Voir les exemples de readdir. HANDLE_REP peut etre une expression dont la valeur 
peut etre employee en tant que handle de repertoire indirect, generalement le non reel 
du handle du repertoire. 



connect 

connect SOCKET, NOM 

Cette fonction demarre une connexion avec un autre processus qui attend par un ac- 
cept. La fonction renvoie vrai si elle reussit, faux sinon. NOM doit etre une adresse reseau 
binaire du type correspondant a celui de la socket. Par exemple, en supposant que SOCK 
soit une socket creee prealablement : 

use Socket; 

my ($distant, $port) = ("www.perl.com", 80); 

my $adr_dest = sockaddr_in($port, inet_aton($distant)); 

connect SOCK, $adr_dest 

or die "Connexion impossible vers $distant sur le port $port : $!"; 

Pour deconnecter une socket, utilisez soit close, soit shutdown. Voir aussi les exemples 
de la section Sockets au chapitre 16. Voir connect(2). 



cos E 

cos EXPR 
cos 

Cette fonction renvoie le cosinus de EXPR (exprimee en radians). Par exemple, le script 
suivant affiche une table des cosinus d'angles mesures en degres : 

# Voici la maniere de ne pas se fatiguer pour convertir de degres en radians 



$pi = atan2(l,l) * 4; 
$pi_apres_l80 = $pi/l80; 



# Affiche la table 

for ($deg = 0; $deg <= 90; $deg++) { 

printf "%3d %7.5f\n", $deg, cos($deg * $pi_apres_l80); 

} 

Pour l'operation cosinus inverse, vous pouvez utilisez la fonction acos() des modules 
Math: :Trig ou POSIX, ou encore utiliser cette relation : 

sub acos { atan2( sqrt(l - $_[o] * $_[o]), $_[o] ) } 
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crypt no 

crypt TEXTE_EN_CLAIR, PERTURBATION 

Cette fonction calcule le hachage non bijectif d'une chaine exactement comme le fait 
crypt(3). Ceci s'avere tres utile pur verifier que le fichier de mots de passe n'en contient 
pas qui soient trop faibles 3 , bien que ce que vous vouliez reellement faire est d'empe- 
cher les gens de commencer a en ajouter de mauvais. 

crypt se veut une fonction non bijective, un peu comme casser des ceufs pour faire une 
omelette. II n'existe aucun moyen (connu) de decrypter un mot de passe chiffre, a moins 
d'essayer de deviner toutes les combinaisons de maniere exhaustive. 

Lorsque vous verifiez une chaine cryptee existante, vous devez utiliser le texte chiffre en 
tant que PERTURBATION (comme crypt($texte_en_clair, $crypte) eq $crypte). Ceci 
permet a votre code de fonctionner avec le crypt standard ainsi qu'avec d'autres imple- 
mentations plus exotiques. 

Lorsque vous choisissez une nouvelle PERTURBATION, vous avez au moins besoin de creer 
une chaine de deux caracteres aleatoires appartenant a l'ensemble [ . /0-9A-Za-z] (com- 
me join ('.', '/', 0..9, 'k'..'V, 'a'..'z')[rand 64, rand 64]). Lesan- 
ciennes implementations de crypt avaient seulement besoin des deux premiers 
caracteres de PERTURBATION, mais le code qui donnait seulement les deux premiers ca- 
racteres est maintenant considere comme non portable. Voir votre page de manuel lo- 
cale de crypt(3) pour des details interessants. 

Voici un exemple qui s'assure que quiconque lancant ce programme connait son propre 
mot de passe : 

$mot_de_passe = (getpwuid ($<))[!] # Suppose que l'on soit sur Unix. 



system "stty -echo"; # ou regarder Term: :Readkey dans CPAN 

print "Mot de passe : 

chomp($mot = <STDIN>); 

print "\n"; 

system "stty echo"; 

if (crypt($motj $mot_de_passe) ne $mot_de_passe) { 

print "DesoleAn"; 
} else { 

print "ok\n"; 

} 

II est bien stir deconseille de donner votre mot de passe a quiconque le demande car c'est 
imprudent. 

Les mots de passes caches sont legerement plus stirs que les fichiers de mots de passe tra- 
ditionnels et vous devez etre le super-utilisateur pour y acceder. Comme peu de pro- 
grammes doivent tourner avec des privileges si puissants, il se peut que le programme 
maintienne son propre systeme d'autentification independant en stockant les chaines 
cryptees dans un fichier autre que /etc/passwd ou /etc/shadow. 



3. Seules les personnes qui ont des intentions louables sont autorisees a faire ceci. 
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La fonction crypt n'est pas adaptee au chiffrement de grandes quantites de donnees, au 
moins parce que vous ne pouvez pas retrouver en sens inverse l'information en clair. 
Regardez dans les repertoires by-moduk/Crypt et by-module/PGP de votre miroir favori de 
CPAN pour trouver un grand nombre de modules potentiellement utiles. 

dbmclose m GO 

dbmclose HACHAGE 

Cette fonction brise le lien entre un fichier DBM (DataBase Management, gestion de base 
de donnees) et un hachage. dbmclose n'est en fait qu'un appel a untie avec les bons ar- 
guments, mais est fournie pour des raisons de compatibilite avec les anciennes versions 
de Perl. 

dbmopen m DO 

dbmopen HACHAGE, NOMDB, MODE 

Relie un fichier DBM a un hachage. (DBM signifie DataBase Management, gestion de 
base de donnees, et consiste en un ensemble de routines de bibliotheque C qui permet- 
tent un acces direct a des enregistrements via un algorithme de hachage.) HACHAGE est le 
nom de la base de donnees (sans Fextension .dir ou .pg). Si la base de donnees n'existe 
pas et qu'un MODE valide est specifie, la base de donnees est creee avec les protections spe- 
cifiees par MODE, modifie par le umask. Pour empecher la creation de la base donnees au 
cas ou elle n'existe pas, il est possible de specifier un mode valant undef, et la fonction 
renverra faux si elle ne peut trouver de base existante. Les valeurs associees au hachage 
avant le dbmopen ne sont plus accessibles. 

La fonction dbmopen n'est en fait qu'un appel a tie avec les arguments appropries, mais 
elle est fournie pour des raisons de compatibilite avec les anciennes versions de Perl. 
Vous pouvez controler quelle est bibliotheque DBM a utiliser en employant directe- 
ment l'interface tie ou en chargeant le module approprie avant d'appeler open. Voici 
un exemple qui fonctionne sur certains systemes pour les versions de DB_f ile similaires 
a celle de votre navigateur Netscape : 

use Dbfile; 

dbmopen (%NS_hist, "$ENV{H0ME}/. netscape/history. dat", undef) 

or die "Impossible d'ouvrir le fichier d'historique de netscape : $!"; 

while (($url, $quand) = each %NS_hist) { 
next unless def ined($quand) ; 

chop ($url, $quand); # supprime les octets nuls a fin 
printf "Derniere visite de %s le %s.\n", $url, 
scalar(localtime(unpack("V", $quand))); 

} 

Si vous n'avez pas d'acces au fichier DBM en ecriture, vous pourrez seulement lire les 
variables du hachage sans les modifier. Pour tester si vous pouvez ecrire, utilisez soit un 
test de fichier comme -w, soit essayez de modifier une entree dans un hachage bidon a 
l'interieur d'un eval {}, ce qui interceptera l'exception. 

Les fonctions comme keys et values peuvent renvoyer une importante liste de valeurs 
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lorsqu'on les utilise avec de grands fichiers DBM. Vous prefererez sans doute utiliser la 
fonction each pour les parcourir iterativement et ne pas tout charger d'un bloc en me- 
moire. 

Les hachages lies a des fichiers DBM ont les memes limitations que le type de paquetage 
DBM que vous utilisez, notamment pour ce qui concerne la dimension de ce qu'on peut 
mettre dans une cellule (bucket). Si vous vous restreignez a des clefs et des valeurs cour- 
tes, cela ne constitue que rarement un probleme. Voir aussi le module DB_f ile au cha- 
pitre 32. 

Une autre chose dont il faut tenir compte est que de nombreuses bases de donnees DBM 
existantes contiennent des clefs et des valeurs terminees par un caractere nul car elles 
ont ete concues pour etre exploiters par des programmes C. Le fichier d'historique de 
Netscape et le fichier d'alias des anciens sendmail en sont des exemples. II vous suffit 
d'utiliser "$key\0" lorsque vous extrayez une valeur, puis de supprimer le caractere nul 
dans cette derniere. 

$alias = $les_alias{"postmaster\0"}; 

chop $alias; # supprime le caractere nul 

II n'existe a l'heure actuelle aucun moyen integre de verrouiller un fichier DBM gene- 
rique. Certains pourraient considerer qu'il s'agit d'un bogue. Le module CDBM_f ile per- 
met lui de verrouiller l'ensemble du fichier. En cas de doute, il vaut mieux utiliser un 
fichier verrou separe. 

defined E 

defined EXPR 
defined 

Cette fonction renvoie une valeur booleenne selon que EXPR contient une valeur defi- 
nie ou non. La plupart des donnees que vous manipulez sont definies, mais un scalaire 
qui ne contient ni de chaine valide, ni valeur numerique, ni de reference est considere 
contenir la valeur indefinie, ou pour abreger undef. Initialiser une variable scalaire a 
une valeur particuliere la rendra definie et elle restera definie jusqu'a ce que vous lui 
assigniez une valeur indefinie ou que vous appeliez explicitement undef avec cette va- 
riable comme parametre. 

De nombreuses operations renvoient undef dans des conditions exceptionnelles, com- 
me une fin de fichier, une variable non initialisee, une erreur systeme, etc. Puisque un- 
def n'est qu'un type de valeur fausse, un simple test booleen ne fait pas de distinction 
entre undef, le chiffre zero, la chaine vide et la chaine d'un seul caractere, « 0 » — tou- 
tes ces valeurs sont fausses de la meme maniere. La fonction defined vous permet de 
distinguer entre une chaine vide indefinie et une chaine vide definie lorsque vous em- 
ployez des operateurs susceptibles de renvoyer une veritable chaine vide. 

Voici un morceau de code qui teste une valeur scalaire d'un hachage : 

print if defined $option{D}; 

Lorsqu'on l'utilise sur un element de hachage comme ceci, defined ne fait qu'indiquer 
si la valeur est definie, et non si la clef possede une entree dans le hachage. II est possible 
d'avoir une clef dont la valeur est indefinie ; cependant la clef elle-meme existe. Utilisez 
exist pour determiner si une clef de hachage existe. 
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Dans l'exemple suivant, nous exploitons la convention qui fait que certaines operations 
renvoient une valeur indefinie lorsqu'il n'y a plus de donnees. 

print "$val\n" while defined ($val = pop(@tableau)); 

Et dans celui-ci, nous faisons la mime chose avec la fonction getpwent pour obtenir des 
informations a propos des utilisateurs du systeme : 

setpwent(); while (def ined($nom = getpwent())) { 
print "< <$nom> >\n"; 

} 

endpwent() ; 

II en va de meme pour les erreurs renvoyees par les appels systeme qui peuvent legiti- 
mement renvoyer une valeur fausse : 

die "readlink $sym impossible : $!" 

unless def ined($valeur = readlink $sym); 

Vous pouvez egalement utiliser defined pour determiner si un sous-programme a 
d'ores et deja ete defini. Ceci evite de se surcharger avec des sous-programmes inexis- 
tants (ou des sous-programmes qui on ete declares mais jamais definis) : 

indirect ("nom_fonction" , @liste_args); 
sub indirect { 

my $nom_routine = shift; 

no strict J refs'; # ainsi nous pouvons utiliser 

# nom_routine indirectement 
if (defined &$nom_routine) { 

&$nom_routine([5)_); # ou $nom_routine->(@_); 
} else { 

warn "Appel ignore a une fonction invalide $nom_routine"; 

} 

} 

L'utilisation de defined sur les agregats (hachages et tableaux) est depreciee. (On l'utili- 
sait pour savoir si la memoire pour cet agregat avait jamais ete allouee.) A la place, em- 
ployez un simple test booleen pour voir si si le tableau ou le hachage possede des 
elements : 

if (|5>un_tableau) { print "tableau possedant des elements\n"; 
if (%un_hachage) { print "hachage possedant des elements\n"; 

Voir aussi undef et exists. 

delete 

delete EXPR 

Cette fonction supprime un element (ou une tranche d'elements) dans le hachage ou le 
tableau specifie. (Voir unlink si vous voulez supprimer un fichier.) Les elements suppri- 
mes sont renvoyes dans l'ordre specifie, bien que ce comportement ne soit pas garanti 
dans le cas de variables liees comme les fichiers DBM. Apres la suppression, la fonction 
exists renverra faux pour toute clef ou indice supprime. (A l'oppose, apres la fonction 
undef, la fonction exists continue de renvoyer vrai, car la fonction undef ne fait que 
rendre indefinie la valeur d'un element, mais ne supprime pas l'element lui-meme.) 
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Supprimer dans le hachage %ENV modifie l'environnement. Les supprimer dans un ha- 
chage qui est lie a un fichier DBM (dans lequel on a les droits en ecriture) supprime Fen- 
tree dans ce fichier DBM. 

Historiquement, vous pouviez seulement supprimer dans un hachage, mais avec Perl 
version 5.6 vous pouvez egalement supprimer dans un tableau. Une suppression dans 
un tableau a pour consequence que l'element a la position specifiee retourne dans un 
etat non initialise, mais sans combler le vide, puisque ceci modifierait les positions de 
toutes les entrees suivantes. Utilisez un splice pour cela. (Toutefois, si vous supprimez 
le dernier element d'un tableau, la taille de celui-ci diminuera de un — ou plus, selon 
la position de l'element existant precedent s'il y en a.) 

EXPR peut etre arbitrairement complexe, pourvu que l'operation ultime soit une consul- 
tation de hachage ou de tableau : 

# installation d'un tableau de tableau de hachage 
$donjon[$x] [$y] = \%proprietes; 

# supprimer une propriete dans le hachage 
delete $donjon[$x] [$y]{0CCUPE} 

# supprimer trois proprietes dans le hachage d'un seul coup 
delete @{ $donjon[$x] [$y] }{ "OCCUPE", "HUMIDE", "ECLAIRE" }; 

# supprimer la reference a %proprietes dans le tableau 
delete $donjon[$x] [$y]; 

L'exemple naif qui suit supprime toutes les valeurs d'un %hachage de maniere 
inefficace : 

foreach $clef (keys %hachage) { 
delete $hachage{$clef }; 

} 

De meme que celui-ci : 

delete (5)hachage{keys %hachage}; 

Mais ces deux exemples sont plus lents que si Ton assigne simplement au hachage la liste 
vide ou qu'on le rende indefini : 

%hachage = (); # vide entierement %hachage 

undef %hachage; # oublie que %hachage a jamais existe 

II en va de meme pour les tableaux : 

foreach $indice (0.. $#tableau) { 
delete $tableau[$indice] ; 

} 

et: 

delete @tableau[0 .. $#tableau]; 

sont moins efficaces que : 

^tableau = (); # vide entierement (^tableau 

undef ^tableau; # oublie que ^tableau a jamais existe 
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die H 

die LISTE 
die 

Hors d'un eval, cette fonction affiche la valeur concatenee de LISTE sur STDERR et sort 
avec la valeur courante de $ ! (la variable errno de la bibliotheque C). Si $ ! vaut 0, elle 
sort avec la valeur de $? >> 8 (qui est le statut du dernier fils recolte depuis un system, 
unwait, un close sur un pipe, ouune 'commande'). Si $? >> 8 vaut 0, elle sort avec 255. 

A Pinterieur d'un eval, la fonction met le message d'erreur qui aurait autrement ete 
produit dans la variable $@, puis elle interrompt le eval, qui renvoie undef. La fonction 
die peut ainsi etre utilisee pour lever des exceptions nominees susceptibles d'etre ex- 
ploiters a un plus haut niveau dans le programme. Voir eval plus loin dans ce chapitre. 

Si LISTE est une reference vers un objet unique, cet objet est suppose etre un objet ex- 
ception et il est renvoye sans modification comme l'exception dans $@. 

Si LISTE est vide et que $@ contient deja une chaine (provenant generalement d'un pre- 
cedent eval), cette chaine est reutilisee en lui ajoutant "\t . . . propagated". Ceci est uti- 
le pour propager (lever a nouveau) des exceptions : 

eval { ... }; 

die unless $@ =~ /Exception attendue/; 

Si LISTE est vide et que $@ contient deja un objet exception, la methode $@- >PR0PACATE 
est appelee pour determiner comment l'exception doit etre propagee. 

Si LISTE est vide ainsi que $@, la chaine "Died" est utilisee. 

Si la valeur finale de LISTE ne se termine pas par un saut de ligne (et que vous ne passez 
pas d'objet exception), le nom du script courant, le numero de ligne et le numero de 
ligne du fichier d'entree (s'il existe) sont ajoutes au message, ainsi qu'un saut de ligne. 
Astuce : quelque fois, le fait d'ajouter " , stopped" a votre message le rendra plus expli- 
cite quand la chaine "at nom_de_script line 123" lui sera ajoutee. Supposons que 
vous lanciez le script canasta ; considerez la difference entre les deux manieres suivantes 
de mourir : 

die "/usr/games ne vaut rien"; 

die "/usr/games ne vaut rien, stopped"; 

qui produisent respectivement : 

/usr/games ne vaut rien at canasta line 123. 
/usr/games ne vaut rien, stopped at canasta line 123. 

Si vous desirez que vos propres messages donnent le nom de fichier et le numero de li- 
gne, employez les tokens speciaux FILE et LINE : 

die "", _FILE_, "', ligne LINE , ", hou la honte !\n"; 

La sortie ressemblera alors a : 

"canasta", ligne 38, hou la honte ! 

Une autre question de style — considerez les exemples equivalents suivants : 

die "Impossible de faire un cd vers le spool : $!\n" 
unless chdir Vusr/spool/news'; 
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chdir '/usr/spool/news' 

or die "Impossible de faire un cd vers le spool : $!\n"; 

Comme la partie importante est le chdir, on prefere generalement la seconde forme. 

Voir egalement exit, warm, %SIC et le module Carp. 

do (bloc) 

do BLOC 

La forme do BLOC execute la sequence de commandes indiquee par BLOC et renvoie la 
valeur de la derniere expression evaluee dans le bloc. Lorsqu'elle est modifiee par une 
instruction while ou until, Perl execute le BLOC une fois avant de tester la condition de 
sortie. (Pour d'autres instructions, les modificateurs de boucle testent la condition en 
premier.) Le do BLOC lui-meme ne compte pas comme une boucle, ainsi les instructions 
de controle de boucle next, last ou redo ne peuvent pas etre utilisees pour quitter ou 
recommencer le bloc. Voir la section Blocs simples au chapitre 4, Instruction et declaration, 
pour contourner ce probleme. 

do (fichier) g 

do FICHIER 

La forme do FICHIER utilise la valeur de FICHIER comme nom de fichier et execute son 
contenu comme un script Perl. Son usage premier est (ou plutot etait) d'inclure des 
sous-programmes depuis une bibliotheque Perl, de sorte que : 

do 'stat.pl'; 

est identique a : 

scalar eval 'cat stat.pl'; #'type stat.pl' sur Windows 

sauf que la premiere forme est plus efficace, plus concise, elle garde la trace du nom de 
fichier courant pour les messages d'erreur, cherche dans tous les repertoires du tableau 
@INC et met a jour %INC si le fichier est trouve. (Voir au chapitre 28, Noms speciaux.) Elle 
differe egalement dans le fait que le code evalue avec do FICHIER ne peut pas voir les 
variables lexicales dans la portee qui l'englobe, a l'inverse du code dans eval FICHIER. 
Mais elle est pourtant similaire a la seconde en ce qu'elle rescrute le fichier a chaque ap- 
pel, et il vaut mieux ne pas l'employer dans une boucle a moins que le nom du fichier 
lui-meme change a chaque iteration. 

Si do ne peut pas lire le fichier, elle renvoie undef et met l'erreur dans $ ! . Si do peut lire 
le fichier mais pas le compiler, elle retourne undef et met un message d'erreur dans $@. 
Si le fichier est compile avec succes, do renvoie la valeur de la derniere expression eva- 
luee. 

L'inclusion de modules de bibliotheques (qui ont obligatoirement un suffixe .pm) est 
mieux geree par les operateurs use et require, qui controlent les erreurs et levent une 
exception s'il y a un probleme. lis ont egalement d'autres avantages : ils evitent de du- 
pliquer le chargement, facilitent la programmation orientee objet et fournissent des in- 
dications au compilateur sur les prototypes de fonctions. 

Mais do FICHIER est toujours utile pour des choses comme la lecture de fichiers de con- 
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figuration. On peut faire un controle d'erreur manuel comme ceci : 

# lit dans les fichiers de configuration : systeme d'abord, 

# ensuite utilisateur 

for $fichier ("/usr/share/projet/defaut.rc", 
"$ENV{HOME}/.programmerc") 

{ 

unless ($retour = do $fichier) { 

warn "Impossible de scruter $fichier : $@" if $@; 

warn "Impossible de faire do $fichier : $!" unless defined $retour; 

warn "Impossible de lancer $fichier" unless $retour; 

} 

} 

Un demon qui doit tourner longtemps peut periodiquement examiner la date de son 
fichier de configuration, et si le fichier a ete modifie depuis sa derniere lecture, le de- 
mon peut utiliser do pour recharger le fichier. II est plus propre de le faire avec do 
qu'avec require ou use. 

do (sous-programme) g 

d o SOUS - PROGRAMME (LISTE) 

La forme do SOUS-PROGRAMME (LISTE) est une forme depreciee d'appel d'un sous-pro- 
gramme. Une exception est levee si le SOUS- PROGRAMME n'est pas defini. Voir le chapitre 
6, Sous-programmes. 

dump 

dump LABEL 
dump 

Cette fonction provoque un core dump immediat. En premier lieu, ceci vous permet 
d'utiliser le programme undump(l) (non fourni) pour transformer le fichier de copie re- 
sultant en un binaire executable apres avoir initialise toutes les variables au debut du 
programme. Quand le nouveau binaire sera execute, il commencera par un goto LABEL 
(avec toutes les restrictions inherentes a goto). On peut voir le processus complet com- 
me un saut inconditionnel avec un core dump, suivi d'une reincarnation. Si LABEL est 
omis, le programme repart du debut. Attention : tout fichier ouvert au moment de la 
copie avec dump, ne le sera plus au moment de la reincarnation du programme, d'oii une 
possible confusion de la part de Perl. Voyez egalement l'option de ligne de commande 
-u au chapitre 19, Interface de la ligne de commande. 

Cette fonction est maintenant tout a fait obsolete, en partie parce qu'il est extremement 
difficile de convertir un core dump en un binaire dans le cas general, et parce que les di- 
vers compilateurs generant du bytecode portable ou du C compilable Font surpasse. 

Si vous desirez utiliser dump pour accelerer vos programmes, allez voir la discussion con- 
cernant les questions d'efficacite au chapitre 24, Usage courant, ainsi que le compilateur 
en code natif au chapitre 18, Compilation. L'autochargement peut egalement presenter 
un certain interet, en ce qu'il semble accelerer l'execution. 
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each 

each HACHAGE 

Cette fonction parcours pas a pas un hachage a raison d'une paire clef/valeur a la fois. 
Appelee dans un contexte de liste, each renvoie une liste a deux elements composee de 
la clef et de la valeur de l'entree suivante d'un hachage, il vous est ainsi possible de cir- 
culer dans la liste toute entiere. Appelee dans un contexte scalaire, each renvoie seule- 
ment la clef de l'entree suivante du hachage. Quand le hachage est entierement lu, elle 
renvoie la liste vide, qui produit une valeur fausse lorsqu'elle est assignee dans un con- 
texte scalaire, comme un test de boucle. L'appel suivant a each redemarrera une nouvel- 
le iteration. On l'utilise generalement comme dans l'exemple suivant qui utilise le 
hachage predefini %ENV : 

while (($clef, $valeur) = each %ENV) { 
print "$clef=$valeur\n"; 

} 

En interne, un hachage conserve ses entrees dans un ordre apparemment aleatoire. La 
fonction each boucle le long de cette sequence car chaque hachage se souvient de l'en- 
tree renvoyee en dernier. L'ordre reel de cette sequence est susceptible de changer dans 
les prochaines versions de Perl, mais il est garanti qu'il sera identique a celui que ren- 
verrait la fonction keys (ou values) avec le meme hachage (sans modification). 

II existe un iterateur unique pour chaque hachage, partage par tous les appels aux fonc- 
tions each, keys et values du programme ; on peut le remettre a zero en lisant tous les 
elements du hachage, ou en evaluant keys %hachage ou values %hachage. Si vous ajou- 
tez ou supprimez des elements d'un hachage pendant qu'il y a une iteration sur celui- 
ci, les consequences ne sont pas bien definies : des entrees peuvent etre passees ou du- 
pliquees. 

Voir aussi keys, values et sort. 




eof HANDL EFICHIER 

eof() 

eof 

Cette fonction renvoie vrai si la lecture suivante sur HANDLE_FICHIER renverra une fin 
de fichier, ou si HANDLE_FICHIER n'est pas ouvert. HANDLE_FICHIER peut etre une expres- 
sion dont la valeur donne le vrai nom du handle de fichier. Un eof sans argument ren- 
voie le statut de fin de fichier pour le dernier fichier lu. Un eof () avec des parentheses 
vides teste le handle de fichier ARGV (plus generalement rencontre en tant que handle 
de fichier nul dans <>). Ainsi, a l'interieur d'une boucle while (<>), un eof () avec pa- 
rentheses ne detectera la fin que du dernier d'un groupe de fichiers. Utilisez eof (sans 
parentheses) pour tester chacun des fichiers dans une boucle while (<>). Par exemple 
le code suivant insere des tirets juste avant la derniere ligne du dernier fichier : 

while (<>) { 

if (eof()) { 

print "-" x 30, "\n"; 

} 



Fonctions Perl par ordre alphabetique 



669 



print; 

} 

Pour sa part, ce script remet a zero la numerotation des lignes pour chaque fichier d'en- 
tree : 

# remet a zero la numerotation des lignes pour chaque fichier d'entree 
while (<>) { 

next if / A \s*#/; # passe les commentaires 

print "$.\t$_"; 
} continue { 

close ARGV if eof; # Et non eof() ! 

} 

De meme que « $ » dans un programme sed, eof brille particulierement dans les nume- 
rotations de lignes par zones. Voici un script qui affiche les lignes de /motif / a la fin de 
chaque fichier d'entree : 

while (<>) { 

print if /motif/ . . eof; 

} 

Ici, l'operateur de bascule ( . . ) evalue la correspondance du motif a chaque ligne. Jus- 
qu'a ce que le motif corresponde, l'operateur renvoie faux. Quand la correspondance est 
enfin trouvee, l'operateur commence par renvoyer vrai, provoquant ainsi l'affichage des 
lignes. Quand l'operateur eof renvoie finalement vrai (a la fin du fichier examine), 
l'operateur de bascule se remet a zero et renvoie de nouveau faux pour le prochain fi- 
chier dans @ARGV 

Attention : la fonction eof lisant un octet puis le remettant dans le flux d'entree avec 
ungetc(3), elle n'est pas tres utile dans un contexte interactif. En fait, les programmeurs 
Perl experimentes utilisent rarement eof, puisque les divers operateurs d'entree se com- 
portent plutot bien dans les expressions conditionnelles des boucles while. Reportez- 
vous a l'exemple de la description de foreach au chapitre 4. 



eval E EE 

eval BLOC 
eval EXPR 
eval 

Le mot-cle eval dessert en Perl deux buts differents mais neanmoins lies. Ces buts sont 
representes par deux formes de syntaxe, eval BLOC et eval EXPR. La premiere forme in- 
tercepte les exceptions a l'execution (erreurs) qui auraient sinon provoque une erreur 
fatale, de la meme maniere qu'un « bloc try » en C++ ou en Java. La seconde forme com- 
pile et execute de petits morceaux de code a la volee et intercepte egalement (et c'est 
bien commode) les exceptions exactement comme la premiere forme. Mais la seconde 
forme s'execute beaucoup plus lentement que la premiere, puisqu'elle doit analyser la 
chaihe a chaque fois. D'un autre cote, elle est aussi plus generique. Quelle que soit la 
forme que vous utilisez, eval est la maniere standard d'intercepter les exceptions en 
Perl. 

Pour chacune des formes, la valeur renvoyee par eval est celle de la derniere expression 
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evaluee, tout comme dans un sous-programme. Vous pouvez de meme utiliser l'opera- 
teur return pour renvoyer une valeur au beau milieu de Feval. L'expression generant 
la valeur de retour est evaluee dans un contexte vide, scalaire ou de liste, selon le con- 
texte de l'eval lui-meme. Voir wantarray pour plus d'informations sur la maniere de 
determiner un contexte. 

S'il se produit une erreur interceptable (y compris une erreur engendree par Foperateur 
die), eval renvoie undef et met le message d'erreur (ou Fobjet) dans $@. S'il n'y a pas 
d'erreur, $@ est garantie contenir la chaine vide, vous pouvez ainsi detecter les erreurs 
apres coup de maniere fiable. Un simple test booleen suffit. 

eval {...}; # intercepte les erreurs a l'execution 
if ($@) { ... } # gere les erreurs 

La forme eval BLOC est verifiee syntaxiquement durant la compilation, ce qui la rend as- 
sez performante. (Cela trouble de temps a autre les personnes habituees a la forme lente 
eval EXPR.) Puisque le code du BLOC est evalue a la compilation en meme temps que le 
code qui Fentoure, cette forme d'eval ne peut pas intercepter les erreurs de syntaxe. 

La forme eval EXPR peut quant a elle intercepter les erreurs syntaxiques car elle analyse 
le code durant l'execution. (Si Fanalyse echoue, elle met Ferreur analysee dans $@, com- 
me d'habitude.) Sinon, elle execute la valeur de EXPR comme si c'etait un petit program- 
me Perl. Le code est execute dans le contexte courant du programme Perl, ce qui signifie 
qu'il peut voir toutes les variables lexicales de la portee qui Fenglobe, tout comme les 
definitions de sous-programmes ou de formats. Le code de Feval est traite en tant que 
bloc, toute variable de portee locale declaree a Finterieur de Feval n'existe done que le 
temps de l'eval. (Voir my et local.) Comme dans tout code a Finterieur d'un bloc, il n'y 
a pas besoin de point-virgule a la fin. 

Voici un simple script Perl. II demande a Futilisateur d'entrer une chaine arbitraire de 
code Perl, la compile, l'execute et affiche les eventuelles erreurs qui se sont produites : 

print "\nEntrer du code Perl : "; 

while (<STDIN>) { 
eval; 
print $@; 

print "\nEntrer a nouveau du code Perl : "; 

} 

Voici un programme rename pour changer le nom d'une quantite de fichiers en utili- 
sant une expression Perl : 

#!/usr/bin/perl 

# rename - change les noms des fichiers 
$op = shift; 
for (@ARGV) { 

$ancien = $_; 

eval $op; 

die if $@; 

# la prochaine ligne appelle la fonction interne Perl, 

# non le script du meme nom 
rename($ancien, $_) unless $ancien eq $_; 

} 
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Vous pouvez utiliser ce programme comme ceci : 

$ rename 's/\.orig$//'' *.orig 
$ rename 'y/A-Z/a-z/ unless / A Make/' * 
$ rename '$_ .= ".bad"' *.f 

Puisqu'eval intercepte des erreurs qui sinon seraient fatales, il est tres utile pour deter- 
miner si une fonctionnalite donnee (comme fork ou symlink) est implementee. 

Comme un eval BLOC est verifie syntaxiquement a la compilation, toute erreur de syn- 
taxe est reportee en amont. Ainsi, si votre code est invariant et qu'a la fois un eval EXPR 
et un eval BLOC vous conviennent, la derniere forme est la meilleure. Par exemple : 

# rend la division par zero non fatale 

eval { $reponse = $a / $b; }; warn $@ if $@; 

# idem, mais moins performant si on l'execute plusieurs fois 
eval J $reponse = $a / $b'; warn $(8 if $@; 

# une erreur de syntaxe a la compilation (non intercepted) 
eval { $reponse = }; # MAUVAIS 

# une erreur de syntaxe a l'execution 

eval J $reponse =' ; # positionne $@ 

Ici, le code du BLOC doit etre un code Perl valide pour passer la phase de compilation. 
Le code de VEXPR n'est pas examine avant l'execution, il ne produit done pas d'erreur 
avant d'etre execute. 

Le bloc d'un eval BLOCK ne compters comme une boucle, ainsi les instructions de con- 
trole de boucle next, last et redo ne peuvent pas etre employees pour sortir ou recom- 
mencer le bloc. 



exec no m 

exec CHEMIN LISTE 
exec LISTE 

La fonction exec termine le programme courant, execute une commande externe et n'en 
revient jamais !!! Utilisez system au lieu de exec si vous voulez reprendre le controle 
apres la la fin de la commande. La fonction exec echoue et renvoie faux seulement si la 
commande n'existe pas et si elle est executee directement et non par l'intermediaire 
d'une commande shell de votre systeme (nous en discuterons plus loin). 

S'il n'y a qu'un seul argument scalaire, celui-ci est inspecte pour y chercher des metaca- 
racteres du shell. S'il y en a, l'argument est tout entier passe a l'interpreteur de comman- 
des standard du shell (/bin/sh sous Unix). Sinon, l'argument est decompose en mots et 
execute directement dans un souci d'efficacite, puisqu'on economise ainsi la surcharge 
due au traitement du shell. Cela vous donne egalement plus de controle sur la reprise 
d'erreur si jamais le programme n'existait pas. 

S'il y a plus d'un argument dans la LISTE, ou si LISTE est un tableau avec plus d'une va- 
leur, le shell du systeme ne sera jamais utilise. Ceci evite egalement tout traitement de 
la commande par le shell. La presence ou l'absence de metacaracteres dans les argu- 
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ments n'affecte pas ce comportement declenche par la liste, ce qui en fait la forme ideale 
pour des programmes soucieux de la securite, ne voulant pas s'exposer a des fuites po- 
tentielles dans le shell. 

Cet exemple entrame le remplacement du programme Perl en train de tourner par le 
programme echo, qui affiche la liste d'arguments courante : 

exec 'echo'', J Vos arguments sont @ARGV; 

Cet autre exemple montre que vous pouvez executer un pipeline et non uniquement 
un seul programme : 

exec "sort $f ichier_sortie | uniq" 

or die "Impossible de faire un sort/uniq : $!\n"; 

exec ne revient generalement jamais — si c'est le cas, il retourne toujours faux et vous 
devez verifier $ ! pour savoir ce qui s'est mal passe. Remarquez que dans les anciennes 
versions de Perl, exec (et system) ne vidaient pas votre tampon de sortie, vous deviez 
done activer le vidage du tampon de commande en positionnant $ | sur un ou plusieurs 
handles de fichier pour eviter la perte de la sortie dans le cas d'exec, ou une sortie desor- 
donnee dans le cas de system. La version 5.6 de Perl remedie largement a cette situation. 

Lorsque vous demandez au systeme d'exploitation d'executer un nouveau programme 
a l'interieur d'un processus existant (comme le fait la fonction exec de Perl), vous indi- 
quez au systeme oil se trouve le nouveau programme a executer, mais vous donnez aussi 
au nouveau programme (a travers son premier argument) le nom sous lequel il a ete 
invoque. Habituellement, le nom que vous donnez est juste une copie de l'endroit oil 
se trouve le programme, mais vous n'y etes pas necessairement obliges, puisqu'il y a 
deux arguments distincts au niveau du langage C. Lorsqu'il ne s'agit pas d'une copie, 
vous obtenez comme curieux resultat que le nouveau programme croit qu'il est lance 
sous un nom qui peut etre completement different du veritable chemin dans lequel il 
reside. Cela n'a souvent pas de consequences pour le programme en question, mais cer- 
tains programmes y font attention et adoptent une personnalite differente selon ce 
qu'ils pensent etre leur nom. Par exemple, l'editeur vi regarde s'il a ete appele avec 
« vi » ou avec « view ». S'il a ete invoque avec « view », il se met automatiquement en 
mode lecture seule, exactement comme s'il avait ete appele avec l'option de la ligne de 
commande -R. 

Voila ou le parametre optionnel CHEMIN de exec entre en jeu. Syntaxiquement, il vient 
se brancher sur la position d'un objet indirect comme le handle de fichier pour print 
ou printf. Ainsi, il n'y a pas de virgule apres lui car il ne fait pas exactement partie de 
la liste d'arguments. (En un sens, Perl adopte l'approche opposee du systeme d'exploita- 
tion en ce qu'il suppose que le premier argument est le plus important et qu'il vous lais- 
se modifier le chemin s'il differe.) Par exemple : 

$editeur = "/usr/bin/vi"; 

exec $editeur "view", (Sfichiers # active le mode lecture seule 
or die "Impossible d'executer $editeur : $!\n"; 

Comme avec tout objet indirect, vous pouvez egalement remplacer le simple scalaire 
contenant le nom du programme avec un bloc contenant du code arbitraire, ce qui sim- 
plifie l'exemple precedent en donnant : 

exec { "/usr/bin/vi" } "view" (Sfichiers # active le mode lecture seule 
or die "Impossible d'executer /usr/bin/vi : $!\n"; 
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Comme nous l'avons deja evoque, exec traite une liste discrete d'arguments comme une 
indication qu'il doit eviter le traitement du shell. Toutefois, il y a un endroit oil vous 
pourriez etre deroutes. L'appel exec (et egalement system) ne distingue pas un unique 
argument scalaire d'un tableau ne contenant qu'un seul element. 

@args = ("echo surprise"); # une liste a un seul element 
exec |8args # toujours sujet aux fuites du shell 

or die "exec : $!\n"; # car @args == 1 

Pour eviter ceci, vous pouvez utiliser la syntaxe avec CHEMIN, en dupliquant exactement 
le premier argument dans le chemin, ce qui force Interpretation du reste des argu- 
ments a etre une liste, mime s'il n'y en a qu'un seul : 

exec { args[o] } (Sargs # securise meme si la liste n'a qu'un argument 
or die "exec @args impossible : $!"; 

La premiere version, celle avec les parentheses, lance le programme echo en lui passant 
« surprise » comme argument. La seconde version ne fait pas la meme chose — elle 
tente de lancer un programme appele litteralement echo surprise, ne le trouve pas (du 
moins on l'espere) et positionne $ ! a une valeur non nulle indiquant l'echec. 

Comme la fonction exec est le plus souvent utilisee peu apres un fork, on suppose que 
l'on doit passer outre tout ce qui survient normalement lorsqu'un processus Perl se ter- 
mine. Sous un exec, Perl n'appellera pas les blocs END, ni les methodes DESTROY associees 
aux objets. Sinon, vos processus fils se termineraient en faisant le nettoyage alors que 
vous vous attendiez a ce que ce soit le processus parent qui le fasse. (Nous aimerions que 
ce soit le cas dans la vie reelle.) 

Comme c'est une erreur courante d'utiliser exec au lieu de system, Perl vous en avertit 
si la prochaine instruction n'est pas die, warn ou exit, lorsqu'il est lance avec l'option 
populaire de la ligne de commande -w, ou si vous employez le pragma use warnings 
qw(exec syntax). Si vous voulez vraiment faire suivre un exec d'une autre instruction, 
vous pouvez utiliser l'un ou l'autre de ces styles pour eviter l'avertissement : 

exec ('machin') or print STDERR 'exec machin impossible : $!"; 
{ exec (■'machin-') }; print STDERR 'exec machin impossible : $!"; 

Comme dans la seconde ligne ci-dessus, un appel a exec qui est la derniere instruction 
dans un bloc est exempt de cet avertissement. 

Voir aussi system. 



exists 



exists EXPR 

Cette fonction renvoie vrai si la clef de hachage ou l'indice de tableau specifie existe dans 
le hachage ou le tableau. Peu importe que la valeur correspondante soit vraie ou fausse, 
ou meme qu'elle soit definie. 



print "Vraie\n" 
print "DefinieV 
print "Existe\n" 
print "Vrai\n" 
print "DefiniV 
print "ExisteV 



if $hachage{$clef}; 
if defined $hachage{$clef }; 
if exists $hachage{$clef }; 
if $tableau[$indice]; 
if defined $tableau[$indice] ; 
if exists $tableau[$indice]; 
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Un element ne peut etre vrai que s'il est defini, et ne peut etre defini que s'il existe, mais 
Finverse n'est pas forcement valable. 

EXPR peut etre arbitrairement complexe, tant que l'operation finale est une consultation 
de clef de hachage ou d'indice de tableau. 

if (exists $hachage{A}{B}{$clef}) { ... } 

Bien que le dernier element ne vienne pas a exister spontanement seulement parce 
qu'on a teste son existence, c'est le cas de ceux que l'on fait intervenir. Ainsi, $$hacha- 
ge{"A"} et $hachage{"A"}->{"B"} se mettent tous deux a exister. Ce n'est pas une fonc- 
tionnalite de exists en soi ; cela se produit partout ou l'operateur fleche est utilise 
(explicitement ou implicitement) : 

undef $ref if (exists $ref->"Une clef"}) { } 
print $ref; # affiche HASH(Ox80d3d5c) 

Meme si l'element "Une clef" ne se met pas a exister, la variable $ref, indefinie aupa- 
ravant, vient tout a coup contenir un hachage anonyme. C'est une instance surprise 
d'autovivification de ce qui n'apparaissait pas au premier — ou meme au second — coup 
d'ceil comme un contexte lvalue. Ce comportement sera agreablement corrige dans une 
prochaine version. Autrement, vous pouvez emboiter vos appels : 

if ($ref and exists $ref->[$x] and 
exists $ref->[$x] [$y] and 
exists $ref->[$x] [$y]{$clef} and 
exists $ref->[$X][$y]{$clef}[2] ) { } 

Si EXPR est le nom d'un sous-programme, la fonction exists renverra vrai si celui-ci est 
a ete declare, meme s'il n'a pas encore ete defini. L'exemple suivant affiche seulement 
« Existe » : 

sub couic; 

print "Existe\n" if exists Scouic; 
print "Defini\n" if defined &couic; 

L'utilisation d'exists avec le nom d'un sous-programme peut etre utile pour un sous- 
programme AUTOLOAD qui a besoin de savoir si un paquetage particulier veut qu'un sous- 
programme particulier soit defini. Le paquetage peut indiquer ceci en declarant un en- 
tete de sub comme couic. 

exit 

exit EXPR 
exit 

Cette fonction evalue EXPR comme un entier et sort immediatement avec cette valeur 
comme statut d'erreur final du programme. Si EXPR est omise, la fonction sort avec le 
statut 0 (signifiant « aucune erreur »). Voici un fragment qui permet a un utilisateur de 
sortir du programme en entrant x ou X. 

$rep = <STDIN>; 

exit if $rep =~ / A [Xx]/; 

Vous ne devriez pas utiliser exit pour quitter un sous-programme s'il y a la moindre 
chance que quelqu'un veuille intercepter l'erreur qui s'est produite. Utilisez plutot die, 
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qui peut etre intercepts par un eval. Ou alors, utilisez l'une des sur-couches de die du 
module Carp, comme croak ou confess. 

Nous avons dit que la fonction exit sortait immediatement, mais c'etait un mensonge 
d'arracheur de dents. Elle sort aussitot que possible, mais elle appelle tout d'abord les 
routines END defmies afin les gerer les evenements de fin (N.d.T. : at-exit). Ces routines 
ne peuvent pas annuler la terminaison, bien qu'elles puissent changer la valeur de re- 
tour eventuelle en positionnant la variable $?. De la meme maniere, toute classe qui 
definit une methode DESTROY peut invoquer cette methode au nom de tous ses objets 
avant que le programme reel ne finisse. Si vous avez vraiment besoin d'outrepasser le 
traitement avant la terminaison, vous pouvez appeler les fonctions _exit du module 
POSIX pour eviter toutes les operations de END et des destructeurs. Et si POSIX n'est pas 
disponible, vous pouvez faire un exec "/bin/false" ou quelque chose de ce genre. 



Cette fonction renvoie e a la puissance EXPR. Pour obtenir la valeur de e, utilisez juste 
exp(l). Pour effectuer une exponentiation generale de differentes bases, utilisez l'ope- 
rateur ** que nous avons emprunte au FORTRAN : 

use Math: :Complex; 

print -exp(l) ** (i * pi); # affiche 1 



fcntl HANDL E_ FICHIER, FONCTION, SCALAIRE 

Cette fonction appelle les fonctions de controle de fichier de votre systeme d'exploita- 
tion, documentees dans la page de man de fnctl{2). Avant d'appeler fcntl, vous devrez 
probablement tout d'abord ecrire : 

use Fcntl; 

pour charger les definitions correctes des constantes. 

SCALAIRE sera lu ou ecrit (ou les deux) selon la FONCTION. Un pointeur sur la valeur de 
chaine de SCALAIRE sera passe comme troisieme argument de l'appel veritable a fcntl. (Si 
SCALAIRE n'a pas de valeur chaine mais une valeur numerique, celle-ci sera passee direc- 
tement au lieu d'un pointeur sur la valeur chaine.) Voir le module Fcntl pour une des- 
cription des valeurs les plus communes qu'il est possible d'employer pour FONCTION. 

La fonction fcntl levera une exception si elle est utilisee sur un systeme qui n'imple- 
mente pas fcntl{2). Sur les systemes qui au contraire l'implementent, vous pouvez faire 
des choses comme modifier les flags close-on-exec (si vous ne desirez pas jouer avec la 
variable $ A F ($SYSTEM_FD_MAX)), modifier les flags d'entrees/sorties non bloquantes, 
emuler la fonction lockf (3) ou s'arranger pour recevoir un signal SIGIO lorsqu'il y a des 
entrees/sorties en attente. 

Voici un exemple oil Ton rend non bloquant au niveau du systeme, un handle de fichier 
nomme DISTANT. Ceci fait que toute operation d'entree revient immediatement si rien 
n'est disponible lors d'une lecture dans un pipe, une socket ou une ligne serie qui autre- 



exp 



exp EXPR 
exp 




676 



Chapitre 29 — Fonctions 



ment aurait bloque. De meme, les operations de sortie qui bloqueraient normalement, 
renvoient un statut d'echec a la place. (Pour celles-ci, vous feriez mieux de negocier ega- 
lement $ | .) 

use Fcntl qw(F_GETFL F_SETFL 0JI0NBL0CK); 

$flags = fcntl (DISTANT, FGETFL, 0) 

or die "Impossible de lire les flags pour la socket : $!\n"; 
$flags = fcntl (DISTANT, FSETFL, $flags | 0_N0NBL0CK) 

or die "Impossible de modifier les flags de la sockets : $!\n"; 

La valeur de retour de fcntl (et de ioctl) se comporte comme ceci : 



L'appel systeme renvoie 


Perl renvoie 


-1 


undef. 


0 


La chaine « 0 but true ». 


autre chose 


Le meme nombre. 



Perl rend done vrai pour un succes et faux pour un echec, tout en vous laissant facile- 
ment determiner la veritable valeur renvoyee par le systeme d'exploitation : 

$valret = fcntl() | | -1; 

printf "fcntl a vraiment renvoye %d\n", $valret; 

Ici, meme la chaine « 0 but true » affiche 0, grace au format %d. Cette chaine est vraie 
dans un contexte booleen et 0 dans un contexte numerique. (Par bonheur, elle est ega- 
lement exempte des avertissements habituels pour les conversions numeriques inadap- 
tees.) 

fileno @ 

fileno HANDL E_ FICHIER 

Cette fonction renvoie le descripteur de fichier sous-jacent d'un handle de fichier. Si ce 
handle de fichier n'est pas ouvert, fileno renvoie undef. Un descripteur de fichier est un 
petit entier positif comme 0 ou 1, alors que les handles de fichiers comme STDIN ou 
STDOUT sont des symboles. Malheureusement, le systeme d'exploitation ne connait pas 
vos sympathiques symboles. II ne pense aux fichiers ouverts qu'en terme de ces petits 
numeros de fichiers et bien que Perl fasse automatiquement la traduction pour vous, 
vous devrez parfois connaitre le veritable descripteur de fichier. 

Ainsi, par exemple, la fonction fileno est utile pour construire des masques de bits 
pour select et pour passer certains appels systeme obscurs si syscall(2) est implements. 
Elle sert egalement a verifier que la fonction open vous a donne le descripteur de fichier 
que vous vouliez et egalement a determiner si deux handles de fichiers utilisent le 
meme descripteur de fichier systeme. 

if (fileno(CECI) == fileno(CELA)) { 

print "CECI et CELA sont des duplicata\n"; 

} 

Si HANDLE_FICHIER est une expression, sa valeur est prise comme un handle de fichier 
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indirect, generalement son nom ou une reference a quelque chose qui ressemble a un 
objet handle de fichier. 

Attention : ne comptez pas sur une association entre un handle de fichier Perl et un des- 
cripteur de fichier numerique qui soit permanente tout au long de la vie du program- 
me. Si un fichier a ete ferme et rouvert, le descripteur de fichier peut changer. Perl 
s'efforce d'assurer que certains descripteurs de fichiers ne sont pas perdus si un open sur 
eux echoue, mais il ne fait cela que pour les descripteurs de fichiers qui ne depassent pas 
la valeur courante de la variable speciale $ A F ($SYSTEM_MAX_FD) (par defaut, 2). Bien que 
les handles de fichiers STDIN, STDOUT et STDERR demarrent avec les descripteurs de fi- 
chiers 0, 1 et 2 (la convention standard Unix), meme ceux-ci peuvent changer si vous 
commencez a les fermer et les ouvrir sans prendre garde. Ceci dit, vous ne pouvez pas 
avoir d'ennuis avec 0, 1 et 2 aussi longtemps que vous les rouvrez toujours immediate- 
ment apres les avoir fermes. La regie de base sur les systemes Unix est de prendre le des- 
cripteur disponible le plus bas possible, et ce sera celui que vous venez juste de fermer. 

flock M @ GO 

flock HANDL E_ FICHIER, OPERATION 

La fonction flock est l'interface portable de Perl pour le verrouillage de fichiers, bien 
qu'elle ne verrouille un fichier que dans son integralite et non des enregistrements. La 
fonction gere les verrous sur le fichier associe a HANDLE_FICHIER, en renvoyant vrai pour 
un succes et faux sinon. Pour eviter la possibility de perdre des donnees, Perl vide le tam- 
pon de votre HANDLE _FICHIER avant de le verrouiller ou de le deverrouiller. Perl peut 
implementer son flock avec flock(2),fcntl(2), lockf (3) ou des mecanismes de verrouilla- 
ge specifiques a d'autres plate-formes, mais si aucun d'entre eux n'est disponible, appe- 
ler flock leve une exception. Voir la section Verrouillage de fichier au chapitre 16. 

OPERATION peut valoir L0CK_SH, L0CK_EX ou L0CK_UN, combines eventuellement par un 
OU avec L0CK_NB. Ces constantes valent generalement 1, 2, 8 et 4, mais vous pouvez em- 
ployer les noms symboliques si vous les importez depuis le module Fcntl, soit indivi- 
duellement, soit par groupe en utilisant le tag : flock. 

L0CK_SH demande un verrou partage, il est done generalement utilise pour les lectures. 
L0CK_EX demande un verrou exclusif, il est done generalement utilise pour les ecritures. 
L0CK_UN relache un verrou demande auparavant ; fermer le fichier relache egalement 
ses verrous. Si le bit L0CK_NB est employe avec L0CK_SH ou L0CK_EX, flock rend la main 
immediatement au lieu d'attendre un verrou indisponible. Verifiez le statut de retour 
pour voir si vous avez obtenu le verrou que vous avez demande. SI vous n'utilisez pas 
L0CK_NB, vous pouvez attendre indefiniment faeces au verrou. 

Un autre aspect difficile, mais general, de flock est que ses verrous sont simplement con- 
sultatifs. Les verrous discrets sont plus flexibles mais offrent moins de garanties que les 
verrous obligatoires. Cela signifie que les fichiers verrouilles avec flock peuvent etre 
modifies par les programmes qui n'utilisent pas flock. Les voitures qui s'arretent aux 
feux rouges s'entendent bien entre elles, mais pas avec celles qui ne s'arretent pas aux 
feux rouges. Conduisez sur la defensive. 

Certaines implementations de flock ne peuvent pas verrouiller quoique ce soit a travers 
un reseau. Bien qu'en theorie vous puissiez utiliser fcntl, plus specifique au systeme, 
pour cela, le jury (ayant delibere sur le cas pendant a peu pres une decennie) est tou- 



678 



Chapitre 29 — Fonctions 



jours indecis pour determiner si c'est une chose digne de confiance ou non. 

Voici un exemple qui ajoute un message a la fin d'une boite aux lettres sur les systemes 
Unix qui utilisent flock(2) pour verrouiller les boites aux lettres : 

use Fcntl qw/:flock/ # importer les constantes FL0CK_* 
sub monverrou { 

flock(MB0X, L0CK_EX) 

or die "Impossible de verrouiller la boite aux lettres : $!"; 

# dans le cas ou quelqu'un ajoutait quelque chose alors que 
#nous etions en train d'attendre et que notre tampon stdio ne 

# soit pas synchronise 
seek(MB0X, 0, 2) 

or die "Impossible de se positionner a la fin de la boite aux 
lettres : $!"; 

} 

open(MB0X, "> >/usr/spool/mail/$ENV{'USER'}") 

or die "Impossible d'ouvrir la boite aux lettres : $!"; 

mon_verrou(); 

print MBOX $msg, "\n\n"; 

close MBOX 

or die "Impossible de fermer la boite aux lettres : $!"; 

Sur les systemes qui supportent un appel systeme fIock(2) reel, les verrous sont herites 
a travers les appels a fork. Les autres implementations ne sont pas aussi chanceuses et 
sont susceptibles de perdre les verrous a travers les forks. Voir egalement le module 
DB_File au chapitre 32 pour d'autres exemples de flock. 

fork m a 

fork 

Cette fonction cree deux processus a partir d'un seul en invoquant l'appel systeme 
fork(2). En cas de reussite, la fonction renvoie FID du nouveau processus fils au proces- 
sus parent et 0 au processus fils. Si le systeme ne dispose pas des ressources suffisantes 
pour allouer un nouveau processus, l'appel echoue et retourne undef. Les descripteurs 
de fichiers (et parfois les verrous sur ces descripteurs) sont partages, alors que tout le res- 
te est copie — ou moins parait l'etre. 

Dans les versions de Perl anterieures a 5.6, les tampons non vides le restent dans les 
deux processus, ce qui veut dire qu'il vous faut parfois positionner $ | sur un ou plu- 
sieurs handles de fichiers a l'avance pour eviter des sorties dupliquees. 

Voici une facon de blinder presque totalement le lancement d'un processus fils tout en 
testant les erreurs de type « fork impossible » : 

use Errno qw(EAGAIN); 
FORK: { 

if ($pid = fork) { 

# on est ici dans le pere 

# le pid du processus fils est accessible par $pid 

} 
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elsif (defined $pid) { # $pid vaut ici 0 s'il defini 

# on est ici dans le fils 

# le pid du processus pere est accessible par getppid 

} 

elsif ($! == EACAIN) { 

# EAGAIN est l'erreur de fork susceptible d'etre corrigee 
sleep 5; 

redo FORK; 

} 

else { 

# erreur de fork etrange 
die "fork impossible :$!\n"; 

} 

} 

Ces precautions ne sont pas necessaires pour des operations qui font un fork(2) implicite, 
comme system, les apostrophes inverses ou l'ouverture d'un processus comme un han- 
dle de fichier, car Perl reessaye automatiquement un fork en cas d'echec dans ces cas. 
Faites tres attention a terminer le code du fils par un exit, faute de quoi le fils pourrait 
quitter par inadvertance le bloc conditionnel et commencer a executer du code prevu 
pour le seul processus pere. 

Si vous forkez sans meme attendre vos enfants, vous accumulerez les zombies (les pro- 
cessus termines qui n'ont toujours pas de parents qui les attendent). Sur certains syste- 
mes, vous pouvez eviter ceci en positionnant $SIC{CHLD} a "IGNORE" ; sur la plupart, 
vous devrez attendre avec wait vos enfants moribonds. Vous en trouverez des exemples 
dans la description de la fonction wait, ou dans la section Signaux du chapitre 16. 

Si un fils forke herite des descripteurs fichiers systemes comme STDIN ou STDOUT qui 
sont connected a un pipe distant ou a une socket, il se peut que vous deviez les redirigez 
vers/dev/null dans le fils. Ceci car meme lorsque le processus pere se termine, le fils vivra 
avec ses copies de ces handles de fichiers. Le serveur distant (mettons comme un script 
CGI ou une tache lancee en arriere plan par un shell distant) semblera bloquer car il 
attendra que toutes les copies soient fermees. Rouvrir les handles de fichiers systemes en 
les dirigeant vers autre chose corrige ceci. 

Sur la plupart des systemes supportant fork(2), on a porte une attention toute particu- 
liere a ce que la fonction soit performante (par exemple, utilisant une technologie de 
copie en ecriture sur les pages de donnees), ce qui en fait le paradigme dominant de ces 
dernieres decennies pour le multitache. La fonction fork est susceptible de ne pas etre 
implementee efficacement, voire de ne pas etre implementee du tout, sur les systemes 
qui ne ressemblent pas a Unix. Par exemple, Perl 5.6 emule un fork approprie sur les 
systemes de Microsoft, mais sans assurance sur les performances a ce jour. Vous pouvez 
avoir plus de chances ici avec le module Win32 : : Process. 

format 

format NOM = 

ligne d'imaqe 
liste de valeurs 
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Cette fonction declare une sequence nommee de lignes d'images (avec les valeurs asso- 
ciees) a l'usage de la fonction write. Si NOM est omis, le nom par defaut est STDOUT, qui 
est celui du format par defaut pour le handle de fichier STDOUT. Puisque, comme pour 
une declaration de sub, il s'agit d'une declaration globale au paquetage se produisant a 
la compilation, toutes les variables utilisees dans la liste de valeurs doivent etre visibles 
au point de la declaration du format. C'est-a-dire que les variables a portee lexicale doi- 
vent etre auparavant declarees dans le fichier, alors que les variables a portee dynami- 
que peuvent n'etre initialisers qu'au moment oil Ton appelle write. En voici un 
exemple (qui suppose que nous avons deja calcule $cout et $quantite : 

my $chn = "widget"; # Une variable de portee lexicale. 

format Dolie_Sortie = 

Test: @««<«< @||||| @»>» 

$chn, $%, '$' . int($num) 

local $~ = "DolieSortie"; # Selection du format. 

local $num = $cout * $quantite; # Variable de portee dynamique. 

write; 

Tout comme les handles de fichier, les noms de format sont de simples identificateurs 
qui existent dans une table de symboles (paquetage) et peuvent etre pleinement quali- 
fies par le nom du paquetage. Dans les typeglobs des entrees d'une table de symboles, 
les formats resident dans leur propre espace de noms, qui est distinct des handles de fi- 
chiers et de repertoires, des scalaires, des tableaux, des hachages ou des sous-program- 
mes. Cependant, comme pour ces six autres types, un format nomme Nimportequoi 
serait aussi affecte par un local sur le typeglob *Nimportequoi. En d'autres termes, un 
format n'est qu'un machin de plus, contenu dans un typeglob, independant des autres 
machins. 

La section Variables de format du chapitre 7, Formats contient de nombreux details et des 
exemples d'utilisation. Le chapitre 28 decrit les variables internes specifiques aux for- 
mats, et les modules English et FileHandle y fournissent un acces aise. 

formline 

formline IMAGE, LISTE 

II s'agit d'une fonction interne utilisee par les formats, bien que vous puissiez egalement 
l'appeler vous-meme. Elle formate une liste de valeurs d'apres le contenu d' IMAGE, en 
placant la sortie dans l'accumulateur de sortie, $ A A (ou $ACCUMULATOR si vous utilisez le 
module English). Finalement, au moment d'un write, le contenu de $ A A est ecrit vers 
un handle de fichier, mais vous pouvez aussi bien lire $ A A par vous-meme pour ensuite 
le remettre a " ". Typiquement, un format lance un formline par ligne de format, mais 
la fonction formline elle-meme ne fait pas attention au nombre de sauts de ligne inclus 
dans Y IMAGE . Cela veut dire que les tokens ~ et — traitent IMAGE comme une seule ligne. 
II peut done etre necessaire d'employer plusieurs f ormlines pour implementer un uni- 
que format d'enregistrement, comme le compilateur de format le fait en interne. 

Attention si vous mettez des doubles apostrophes autour de l'image, car un caractere @ 



Fonctions Perl par ordre alphabetique 



681 



peut etre confondu avec le debut d'un nom de tableau. Voir le chapitre 7, Formats, pour 
des exemples d'utilisation. 



getc HANDL E_ FICHIE R 
getc 

Cette fonction renvoie le caractere suivant depuis le fichier d'entree attache a 
HANDLE_FICHIER. Elle renvoie undef a la fin du fichier ou si une erreur d'entree/sortie 
se produit. Si HANDLE_FICHIER est omis, la fonction lit depuis STDIN. 

Cette fonction est quelque peu lente, mais se revele parfois utile pour les entrees d'un 
seul caractere (octet, reellement) au clavier — pourvu que vous vous arrangiez pour 
que les entrees depuis le clavier ne passent pas par un tampon. Cette fonction demande 
une entree non tamponnee depuis la bibliotheque standard d'entree/sortie. Malheureu- 
sement, la bibliotheque standard d'entree/sortie n'est pas assez standard pour fournir 
une maniere portable de dire au systeme d'exploitation sous-jacent de donner au syste- 
me d'entree/sortie des entrees non tamponnees depuis le clavier. Pour accomplir ceci, 
vous devez etre un peu plus habile et utiliser un style dependant du systeme d'exploita- 
tion. Sous Unix, vous pourriez dire ceci : 

if ($BSD_STYLE) { 

system "stty cbreak </dev/tty >/dev/tty 2>&1"; 
} else { 

system "stty", "-icanon", "eol", "\001"; 

} 

$clef = getc; 

if ($BSD_STYLE) { 

system "stty -cbreak </dev/tty >/dev/tty 2&1"; 
} else { 

system "stty", "icanon", "eol", # ASCII NUL 

} 

print "\n"; 

Ce code met le prochain caractere (octet) frappe sur le terminal dans la chame $clef. Si 
votre programme stty possede des options comme cbreak, vous devrez utiliser le code 
ou $BSD_STYLE est vrai. Sinon, vous devrez utiliser le code ou il est faux. Determiner les 
options de stty(l) est laisse comme exercice au lecteur. 

Le module POSIX en fournit une version plus portable grace a la fonction POSIX: :ge- 
tattr. Voir aussi le module Term: :ReadKey dans votre site CPAN le plus proche pour 
une approche plus portable et plus flexible. 



Ces routines parcourent votre fichier /etc/group (ou peut-etre le fichier /etc/group de quel- 
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qu'un d'autre, s'il provient d'un serveur quelque part). La valeur renvoyee par getgrent 
dans un contexte de liste est : 

($nom, $mot_de_passe, $gid, $membres) 

oil $membres contient une liste des noms de login des membres du groupe separes par 
des espaces. Pour mettre en oeuvre un hachage traduisant les noms de groupes en GID, 
ecrivez ceci : 

while (($nom, $mot_de_passe, $gid) = getgrent) { 
$gid{$nom} = $gid; 

} 

Dans un contexte scalaire, getgrent renvoie seulement le nom du groupe. Le module 
standard User : : grent supporte une interface orientee par nom pour cette fonction. Voir 

getgrent^). 



getgrid GID 

Cette fonction recherche une entree de fichier de groupe par le numero du groupe. La 
valeur renvoyee dans un contexte de liste est : 

($nom, $mot_de_passe, $gid, $membres) 

ou $membres contient une liste des noms de login des membres du groupe separes par 
des espaces. Si vous voulez faire cela de facon repetitive, il vaut mieux utiliser un hacha- 
ge comme cache en utilisant getgrent. 

Dans un contexte scalaire, getgrid renvoie seulement le nom du groupe. Le module 
standard User : : grent supporte une interface orientee par nom pour cette fonction. Voir 
getgrid(3). 



getgrid NOM 

Cette fonction recherche une entree de fichier de groupe par le nom du groupe. La va- 
leur renvoyee dans un contexte de liste est : 

($nom, $mot_de_passe, $gid, $membres) 

ou $membres contient une liste des noms de login des membres du groupe separes par 
des espaces. Si vous voulez faire cela de facon repetitive, il vaut mieux utiliser un hacha- 
ge comme cache en utilisant getgrent. 

Dans un contexte scalaire, getgrnam renvoie seulement le nom du groupe. Le module 
standard User : : grent supporte une interface orientee « par nom » pour cette fonction. 
Voir getgrnam(3). 



gethostbyaddr ADR, TYPE_ADR 

Cette fonction convertit des adresses en noms (et en adresses alternatives). ADR doit etre 
une adresse reseau binaire empaquetee et TYPE_ADR en pratique doit etre normalement 
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AF_INET (du module Socket). La valeur de retour dans un contexte de liste est : 

($nom, $alias, $type_adr, $longueur, (5>adrs) = 

gethostbyaddr ($adresse_binaire_empaquetee , $type_adr) ; 

oil @adrs est une liste d'adresses brutes. Dans le domaine de l'lnternet, chaque adresse 
est (historiquement) longue de 4 octets et peut etre decoupee en ecrivant quelque chose 
comme ceci : 

($a, $b, $c, $d) = unpack('C4', $adrs[o]); 

Ou alors, vous pouvez directement la convertir dans la notation de vecteur pointe avec 
le modificateur v de sprintf : 

$points = sprintf "%vd", $adrs[o]; 

La fonction inet_ntoa du module Socket est tres utile pour produire une version affi- 
chable. Cette approche deviendra importante si et quand nous parviendrons a passer a 



use Socket; 

$adresse_affichable = inet_ntoa($addrs[o]); 
Dans un contexte scalaire, gethostbyaddr renvoie seulement le nom de l'hote. 
Pour obtenir une ADR a partir d'un vecteur pointe, ecrivez ceci : 

use Socket; 

$adr_ip = inet_aton("l27. 0.0.1"); # localhost 
$nom_officiel = gethostbyaddr ($adr_ip, AF_INET); 

De maniere interessante, vous pouvez avec la version 5.6 de Perl vous passer de 
inet_aton et employer la nouvelle notation v-chaine, qui a ete inventee pour les nume- 
ros de versions, mais il est apparu qu'elle fonctionnait aussi bien pour les adresses IP : 

$adr_ip = V127.0.0.1; 

Voir la section Sockets au chapitre 16 pour plus d'exemples. Le module Net: :hostent 
supporte une interface orientee « par nom » pour cette fonction. Voir gethostbyaddr(3). 



gethostbyname NOM 

Cette fonction convertit un nom d'hote reseau en son adresse correspondante (et en 
d'autres noms). La valeur de retour dans un contexte de liste est : 

($nomj $aliaSj $type_adr, $longueur, @adrs) = 
gethostbyname($nom_hote_distant); 

oil @adrs est une liste d'adresses brutes. Dans le domaine de l'lnternet, chaque adresse 
est (historiquement) longue de 4 octets et peut etre decoupee en ecrivant quelque chose 
comme ceci : 

($a, $b, $c, $d) = unpack('C4', $adrs[o]); 

Vous pouvez directement la convertir dans la notation de vecteur avec le modificateur 
v de sprintf : 

$points = sprintf "%vd", $adrs[o]; 
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Dans un contexte scalaire, get host byname renvoie uniquement Padresse de Phote : 
use Socket; 

$adr_ip = gethostbyname($hote_distant); 
printf "%s a comme adresse %s\n", 

$hote_distant, inet_ntoa($adr_ip); 

Voir la section Sockets au chapitre 16 pour une autre approche. Le module Net : : hos- 
tent supporte une interface orientee par nom pour cette fonction. Voir egalement 
gethostbyname(3). 



gethostent m 

gethostent 

sethostent RESTEOUVERT 
endhostent 

Ces fonctions parcourent votre fichier /etc/hosts et renvoient chaque entree une par une. 
La valeur de retour de gethostent dans un contexte de liste est : 

($nom, $aliaSj $longueur, @adrs) 

oil @adrs est une liste d'adresses brutes. Dans le domaine Internet, chaque adresse est 
longue de 4 octets et peut etre decoupee en ecrivant quelque chose comme ceci : 

($a, $b, $c, $d) = unpack('C4', $adrs[o]); 

Les scripts qui utilisent gethostent ne doivent pas etre considered comme portables. Si 
une machine utilise un serveur de noms, elle interrogera la quasi-totalite de PInternet 
pour tenter de satisfaire une requete portant sur toutes les adresses de toutes les machi- 
nes de la planete. Voir gethostent(3) pour d'autres details. 

Le module Net : : hostent supporte une interface orientee par nom pour cette fonction. 



getlogin m 

getlogin 

Cette fonction renvoie le nom de login courant s'il est trouve. Sur les systemes Unix, il 
est lu k partir du fichier utmp(5). Si la fonction renvoie faux, utilisez getpwuid a la place. 
Par exemple : 

$login = getloginQ || (getpwuid($<))[0]) || "Intrus !!"; 



getnetbyaddr no 

getnetbyaddr ADR, TYPE_ADR 

Cette fonction convertit une adresse reseau vers le nom ou les noms de reseau corres- 
pondants. La valeur renvoyee dans un contexte de liste est : 

use Socket; 

($nomj $aliasj $type_adr, $reseau) = getnetbyaddr (127, AF_INET); 

Dans un contexte scalaire, getnetbyaddr renvoie seulement le nom du reseau. Le mo- 
dule Net: :netent supporte une interface orientee par nom pour cette fonction. Voir 
getnetbyaddr(3). 
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getnetbyname m 

getnetbyname NOM 

Cette fonction convertit un nom de reseau vers son adresse reseau correspondante. La 
valeur de retour dans un contexte de liste est : 

($nom, $aliaSj $type_adr, $reseau) = getnetbyname("loopback"); 

Dans un contexte scalaire, getnetbyname renvoie seulement Fadresse du reseau. Le mo- 
dule Net: :netent supporte une interface orientee par nom pour cette fonction. Voir 
getnetbyname(3). 

getnetent m 

getnetent 

setnetent RESTE_OUVERT 
endnetent 

Ces fonctions parcourent votre fichier /etc/networks. La valeur renvoyee dans un con- 
texte de liste est : 

($nom, $aliaSj $type_adr, $reseau) = getnetentQ; 

Dans un contexte scalaire, getnetent renvoie seulement le nom du reseau. Le module 
Net: :netent supporte une interface orientee par nom pour cette fonction. Voir getne- 
tent^). 

Le concept de nom de reseau semble un peu desuet de nos jours ; la plupart des adresses 
IP etant sur des sous-reseaux innommes (et innommables). 



getpeername SH @ DH 

getpeername SOCKET 

Cette fonction l'adresse socket empaquetee de l'autre extremite de la connexion SOC- 
KET. Par exemple : 

use Socket; 

$son_adr_sock = getpeername SOCK; 
($port, $son_adr) = sockaddr_in($son_adr_sock); 
$son_nom_hote = gethostbyaddr($son_adrj AF_INET); 
$son_adr_chaine = inet_ntoa($son_adr); 



getpgrp m 

getpgrp PID 

Cette fonction renvoie l'identifiant du groupe de processus courant pour le PID specifie 
(employez un PID egal a 0 pour le processus courant). L'invocation de getpgrp levera 
une exception sur une machine n'implementant pasgetpgrp(2). Si PID est omis, la fonc- 
tion renvoie le groupe de processus du processus courant (ce qui est identique a un PID 
de 0). Sur les systemes qui implementent cet operateur avec l'appel systeme POSIX 
getpgrp(2), PID doit etre omis ou, s'il est fourni, doit etre egal a 0. 
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getppid m 

getppid 

Cette fonction renvoie l'identifiant du processus parent. Sur un systeme UNIX typique, 
si FID du processus pere se change en 1, c'est que ce dernier est mort et que le processus 
courant a ete adopte par le programme init(8). 



getpriority @ GO 

getpriority 0U0I, QUI 

Cette fonction renvoie la priorite courante d'un processus, d'un groupe de processus ou 
d'un utilisateur. Voir getpriority •{!). Son invocation levera une exception sur une machi- 
ne oil getpriority(2) n'est pas implementee. 

Le module BSD: : Resource de CPAN fournit une interface plus pratique, comprenant 
les constantes symboliques PRI0_PR0CESS, PRI0_PCRP et PRIOJJSER qu'il faut fournir 
pour Fargument QUOI. Bien qu'elles soient generalement egales a 0, 1 et 2 respective- 
ment, vous ne savez vraiment pas ce qui peut se passer aux sombres confins des fichiers 
iinclude du C. 

Une valeur de 0 pour QUI signifie le processus, le groupe de processus ou Futilisateur 
courant, ainsi pour obtenir la priorite du processus en cours, utilisez : 

$prio_cour = getpriority (0, 0); 



getprotobyname m 

getprotobyname NOM 

Cette fonction convertit un nom de protocole vers son numero correspondant. La va- 
leur renvoyee dans un contexte de liste est : 

($110111, $aliaSj $numero_protocole) = getprotobyname("tcp"); 

Lorsqu'on Fappelle dans un contexte scalaire, getprotobyname renvoie seulement le nu- 
mero de protocole. Le module Net : : proto supporte une interface orientee par nom 
pour cette fonction. Voir getprotobyname(3). 



getprotobynumber GO 

getprotobynumber NUMERO 

Cette fonction convertit un numero de protocole vers son nom correspondant. La va- 
leur renvoyee dans un contexte de liste est : 

($nonij $aliaSj $numero_protocole) = getprotobynumber (6); 

Lorsqu'on Fappelle dans un contexte scalaire, getprotobynumber renvoie seulement le 
nom de protocole. Le module Net: : proto supporte une interface orientee par nom 
pour cette fonction. Voir getprotobynumber(3). 
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getprotoent 

setprotoent RESTEOUVERT 
endprotoent 

Ces fonctions parcourent votre fichier /etc/protocols. Dans un contexte de liste, la valeur 
renvoyee par getprotoent est : 

($nom, $aliaSj $numero_protocole) = getprotoentQ; 

Lorsqu'on l'appelle dans un contexte scalaire, getprotoent renvoie seulement le nume- 
ro du protocole. Le module Net : : protoent supporte une interface orientee par nom 
pour cette fonction. Voir getprotent(3). 



Ces fonctions parcourent conceptuellement votre fichier /etc/passwd, bien que ceci puis- 
se impliquer le fichier /etc/shadow si vous etes le super-utilisateur et que vous utilisez les 
mots de passe « shadow », NIS (ex-Pages Jaunes, Yellow Pages, YP) ou NIS+. La valeur 
renvoyee dans un contexte de liste est : 

($nom, $mot_de_passe , $uid, $gid , $quota, $commentaire, $nom_reel, $rep, $shell) = 
getpwent(); 

Certaines machines peuvent utiliser les champs quota et commentaire a d'autres fins 
que leurs noms ne le laissent supposer, mais les champs restants seront toujours les me- 
mes. Pour mettre en oeuvre un hachage de traduction des noms de login en UID, ecrivez 
ceci : 

while (($nom, $mot_de_passe, $uid) = getpwent()) { 
$uid{$nom} = $uid; 

} 

Dans un contexte scalaire, getpwent renvoie seulement le nom d'utilisateur. Le module 
User::pwent supporte une interface orientee par nom pour cette fonction. Voir 
getpivent(3). 



getpwnam NOM 

Cette fonction convertit un nom d'utilisateur vers l'entree correspondante du fichier 
/etc/passwd. La valeur renvoyee dans un contexte de liste : 

($nom, $mot_de_passe , $uid, $gid , $quota, $commentaire, $nom_reel, $rep, $shell) = 
getpwnam( "daemon" ) ; 

Sur les systemes qui supportent les mots de passe « shadow », vous devrez etre le super- 
utilisateur pour recuperer le veritable mot de passe. Votre bibliotheque C doit remar- 
quer que vous avez les permissions suffisantes et ouvre votre fichier /etc/shadow (ou 
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n'importe quel endroit oil le fichier shadow est conserve). Du moins, c'est cense fonc- 
tionner ainsi. Perl essayera de faire ceci si votre bibliotheque C est trop stupide pour le 
remarquer. 

Pour faire des recherches repetitives, mieux vaut utiliser un hachage comme cache avec 
getpwent. 

Dans un contexte scalaire, getpwnam renvoie seulement l'UID numerique. Le module 
User: :pwent supporte une interface orientee par nom pour cette fonction. Voir getpw- 
nam^) etpasswd(5). 



getpwuid E GO 

getpwuid UID 

Cette fonction convertit un UID numerique vers l'entree correspondante du fichier 
/etc/passwd. La valeur renvoyee dans un contexte de liste : 

($110111, $mot_de_passe , $uid, $gid , $quota , $commentaire, $nom_reel, $rep, $shell) = 
getpwuid(2); 

Pour faire des recherches repetitives, mieux vaut utiliser un hachage comme cache avec 
getpwent. 

Dans un contexte scalaire, getpwuid renvoie seulement le nom de l'utilisateur. Le mo- 
dule User: :pwent supporte une interface orientee « par nom » pour cette fonction. 
Voir getpwnam(3) et passwd(5). 



getservbyname no 

getservbyname NOM, PROTO 

Cette fonction convertit un nom de service (port) vers son numero de port correspon- 
dant. PROTO est un nom de protocole comme "tcp". La valeur renvoyee dans un con- 
texte de liste est : 

($nom, $aliaSj $numero_port , $nom_protocole) = getservbyname("www" , "tcp"); 

Dans un contexte scalaire, getservbyname renvoie seulement le numero du port de ser- 
vice. Le module Net : : servent supporte une interface orientee par nom pour cette fonc- 
tion. Voir getservbyname(3). 



getservbyport m 

getservbyport PORT, PROTO 

Cette fonction convertit un numero de service (port) vers les noms correspondants. 
PROTO est un nom de protocole comme "tcp". La valeur renvoyee dans un contexte de 
liste est : 

($nonij $aliaSj $numero_port , $nom_protocole) = getservbyport(80, "tcp"); 

Dans un contexte scalaire, getservbyport renvoie seulement le nom du service. Le mo- 
dule Net : : servent supporte une interface orientee par nom pour cette fonction. Voir 
getservbyport(3). 
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getservent m 

getservent 

setservent RESTEOUVERT 
endservent 

Cette fonction parcourt votre fichier /etc/services ou son equivalent. La valeur renvoyee 
dans un contexte de liste est : 

($nom, $alias, $numero_port , $nom_protocole) = getserventQ; 

Dans un contexte scalaire, getservent renvoie seulement le nom du port de service. Le 
module Net: :servent supporte une interface orientee par nom pour cette fonction. 
Voir getservent^). 

getsockname @ @ GO 

getsockname SOCKET 

Cette fonction renvoie Fadresse socket empaquetee de cette extremite de la connexion 
SOCKET. (Et pourquoi ne connaitriez vous plus votre propre adresse ? Peut-etre parce que 
vous avez attache une adresse contenant des jokers (wildcards) a la socket serveur avant 
de faire un accept et que maintenant vous avez besoin de savoir a travers quelle inter- 
face quelqu'un est connecte avec vous. Ou la socket vous a ete passee par votre processus 
pere — inetd, par exemple.) 

use Socket; 

$mon_adr_sock = getsockname SOCK; 
($port, $mon_adr) = sockaddr_in($mon_adr_sock); 
$mon_nom = gethostbyaddr($mon_adr, AF_INET); 
printf "De suis %s [%vd]\n", $mon_nom, $mon_adr; 



getsockopt a @ go 

getsockopt SOCKET, NIVEAU, NOM_OPTION 

Cette fonction renvoie l'option de socket requise ou undef en cas d'erreur. Voir setsoc- 
kopt pour plus d'informations. 



glob 

glob EXPR 
glob 

Cette fonction renvoie la valeur de EXPR avec expansion des noms de fichiers, exacte- 
ment comme un shell le ferait. II s'agit de la fonction interne implementant l'operateur 
<*>. 

Pour des raisons historiques, l'algorithme correspond au style d'expansion de cs/?(l) et 
pas a celui du Bourne Shell. Les versions de Perl anterieures a 5.6 utilisaient un proces- 
sus externe, mais la 5.6 et les suivantes executent les globs en interne. Les fichiers dont 
le premier caractere est un point (« . ») sont ignores sauf si ce caractere correspond ex- 
plicitement. Un asterisque (« * ») correspond a n'importe quelle sequence de n'importe 
quels caracteres (y compris aucun). Un point d'interrogation (« ? ») correspond a un 
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unique caractere quel qu'il soit. Une sequence entre crochets («[...] ») specifie une 
simple classe de caracteres, comme « [chyO-9] ». Les classes de caracteres peuvent etre 
niees avec un accent circonf lexe, comme dans « * . [ A oa ] », qui correspond a tous les fi- 
chiers ne commencant pas par un point et dont les noms contiennent un point suivi 
par un seul caractere qui ne soit ni un « a », ni un « o » a la fin du nom. Un tilde (« ~ ») 
se developpe en un repertoire maison, comme dans « ~/ . *rc » pour les fichiers « rc » 
de l'utilisateur courant, ou « ~caro/Mail/* » pour tous les fichiers mails de Caro. On 
peut employer des accolades pour les alternatives, comme dans 
« ~/ . {mail, ex, csh,twm, }rc » pour obtenir ces fichiers rc particuliers. 

Si vous voulez glober sur des noms de fichiers qui peuvent contenir des espaces, vous 
devrez utilisez le module File: :Glob directement, puisque les grands-peres de glob uti- 
lisaient les espaces pour separer plusieurs motifs comme <* . c * . h>. Pour plus de detail, 
voir File: :Clob au chapitre 32. L'appel de glob (ou de l'operateur <*>) fait automati- 
quement un use sur ce module, done si se module s'evapore mysterieusement de votre 
bibliotheque, une exception est levee. 

Lorsque vous appelez open, Perl ne developpe pas les jokers, y compris les tildes. Vous 
devez d'abord glober les resultats. 

open(MAILRC, "~/.mailrc") # FAUX : le tilde est un true du shell 

or die "Impossible d'ouvrir "V.mailrc : $!"; 
open(MAILRC, (glob("~/.mailrc"))[o]) # developpe d'abord le tilde 

or die "Impossible d'ouvrir "V.mailrc : $!"; 

La fonction glob n'a aucun rapport avec la notion Perl de typeglobs, sinon qu'elles uti- 
lisent toutes deux un * pour representer plusieurs elements. 

Voir aussi la section Operateur de globalisation des noms de fichier au chapitre 2. 

gmtime 

gmtime EXPR 
gmtime 

Cette fonction convertit une heure renvoyee par la fonction time en un tableau de neuf 
elements dont Fheure est en phase avec le meridien de Greenwich (alias GMT ou UTC, 
ou meme Zoulou dans certaines cultures, dont ne fait bizarrement pas partie la culture 
Zoulou). Elle est generalement employee comme suit : 

#012 34 5 6 7 8 

($sec , $min, $heure, $mjour, $mois, $annee, $sjour, $a jour, $est_dst) = gmtime () ; 

Si, comme dans ce cas, EXPR est omise, la fonction effectue gmtime(time() ). Le module 
Time: : Local de la bibliotheque Perl contient un sous-programme, timegm, qui peut a 
Finverse convertir la liste vers une valeur de time. 

Tous les elements sont numeriques et proviennent directement d'une struct tm (une 
structure de programmation C ; pas d'affolement). Cela signifie en particulier que $mois 
se situe dans l'intervalle 0 . . 11 avec janvier comme le mois 0 et que $s jour est dans 0 . . 6 
avec dimanche comme jour 0. Vous pouvez vous rappeler de ceux qui commencent par 
zero car ce sont ceux que vous utilisez toujours comme indices dans les tableaux debu- 
tant par zero contenant les noms des mois et des jours. 

Par exemple, pour afficher le mois courant a Londres, vous pouvez ecrire : 
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$mois_londres = (qw((Dan Fev Mar Avr Mai Dun 

Dili Aou Sep Oct Nov Dec)) [(gmtime) [4]]; 

$annee est le nombre d'annees depuis 1900 ; c'est-a-dire qu'en 2023, $annee vaudra 123, 
et pas simplement 23. Pour obtenir l'annee sur 4 chiffres, il suffit d'ecrire $annee+1900. 
Pour l'avoir sur 2 chiffres (par exemple « 01 » en 2001), utilisez sprintf ("%02d", $an- 
nee % 100). 

Dans un contexte scalaire, gmtime renvoie une chaine ressemblant a ctime(3) basee sur 
la valeur de l'heure GMT. Le module Time: : gmtime supporte une interface orientee 
« par nom » pour cette fonction. Voir aussi P0SIX: : strftime pour une approche per- 
mettant de formater des dates avec une granularite plus fine. 

Cette valeur scalaire n'estpas dependante des « locales » mais plutot interne a Perl. Voir 
aussi le module Time: : Local et les fonctions strftime(3) et mktime(3) disponibles via le 
module P0SIX. Pour obtenir des chaines pour la date qui soient similaires mais locales, 
positionnez vos variables d'environnement locales de maniere appropriee (merci de 
voir la page de man pour perllocale) et essayez : 

use P0SIX qw( strftime); 

$chaine_maintenant = strftime "%a %b %e %H:%M:%S %Y" , gmtime; 

Les caracteres d'echappement %a et %b, qui representent la forme abregee pour le jour 
de la semaine et le mois de l'annee, peuvent ne pas etre necessairement de trois caracte- 
res dans toutes les « locales ». 



goto H 

goto ETIQUETTE 
goto EXPR 
goto &N0M 

goto ETIQUETTE trouve l'instruction etiquetee par ETIQUETTE et continue l'execution a 
partir de la. Si V ETIQUETTE est impossible a trouver, une exception est levee. Elle ne peut 
pas etre utilisee pour aller dans une construction demandant une initialisation, comme 
un sous-programme ou une boucle f oreach. De meme, elle ne peut etre employee pour 
rentrer dans une construction optimisee. Elle peut etre utilisee pour aller quasiment 
partout ailleurs dans l'espace de portee d'adressage dynamique, 4 y compris pour sortir 
des sous-programmes, mais il vaut alors mieux employer une autre instruction comme 
last ou die. L'auteur de Perl n'a jamais ressenti le besoin d'utiliser cette forme de goto 
(en Perl — en C, c'est une autre histoire). 

Pour aller plus loin dans l'orthogonalite (et plus profond dans la stupidite), Perl auto- 
rise goto EXPR qui s'attend a ce que EXPR donne un nom d'etiquette, dont l'emplacement 
ne peut jamais etre resolu avant l'execution puisque l'etiquette est inconnue lorsqu'on 
compile l'instruction. Cela permet des gotos calcules comme en FORTRAN mais ce 
n'est pas vraiment recommande 5 lorsqu'on cherche a optimiser la maintenabilite : 



4. Cela veut dire que si elle ne trouve pas l'etiquette dans la routine courante, elle cherche dans 
celles qui l'ont appelee, rendant ainsi la maintenance du programme quasiment impossible. 

5. Les euphemismes sont reputes etre amusants, alors nous avons pense en essayer un ici. 
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goto +("TRUC", "MACHIN", "CHOUETTE" ) [$i] ; 

Sans aucun rapport, le goto MOM fait de la grande magie en substituant un appel au 
sous-programme nomme en lieu et place du sous-programme actuellement en cours. 
Cette construction est utilisee sans scrupule par les sous-programmes AUTOLOAD qui veu- 
lent en charger un autre pour ensuite pretendre que celui-ci — et non Foriginal — a ete 
appele en premier lieu (sauf que toute modification de @_ dans le sous-programme 
d'origine est propagee dans le sous-programme de remplacement). Apres le goto, meme 
caller ne pourra pas dire que la routine AUTOLOAD originelle avait ete appelee en pre- 
mier lieu. 

grep 

grep EXPR, LISTE 
grep BLOC LISTE 

Cette fonction evalue EXPR ou BLOC dans un contexte booleen pour chaque element de 
LISTE, en positionnant temporairement $_ avec chaque element tout a tour, un peu 
comme la construction foreach. Dans un contexte de liste, elle renvoie la liste des ele- 
ments pour lesquels Fexpression est vraie. (L'operateur a ete nomme d'apres le bien- 
aime programme UNIX qui extrait les lignes d'un fichier qui correspondent a un motif 
particulier. En Perl, fexpression est souvent un motif, mais ce n'est pas obligatoire.) 
Dans un contexte scalaire, grep renvoie le nombre d'occurrences ou fexpression est 
vraie. 

A supposer que @toutes_les_lignes contienne des lignes de code, cet exemple elimine 
les lignes de commentaires : 

(5)lignes_de_code = grep !/ A \s*#/, @toutes_les_lignes; 

$_ etant un alias implicite a chaque valeur de la liste, l'alteration de $_ modifiera les ele- 
ments de la liste originelle. Bien que ceci soit utile et supporte, les resultats peuvent de- 
venir bizarres si l'on ne s'y attend pas. Par exemple, 

@liste = qw(barney fred dino wilma); 
(5>liste_grep = grep { s/ A [bfd]// } (Sliste; 

@liste_grep contient maintenant « arney », « red », « ino », mais @liste est devenu 
« arney », « red », « ino », « wilma » ! Danger de bourde de programmeur. 

Voir egalement map. Les deux instructions suivantes sont fonctionnellement equivalen- 
tes : 



(Sisortie = grep { EXPR } @entree; 
loisortie = map { EXPR ?$_:()} @entree 

hex 

hex EXPR 
hex 



Cette fonction interprete EXPR comme une chaine hexadecimale et renvoie la valeur de- 
cimale equivalente. S'il y un « Ox » au debut, il est ignore. Pour interpreter des chames 
commencant soit par 0, soit par Ob, ou par Ox, voir oct. Le code suivant met $nombre a 
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4 294 906 560 : 

$nombre = hex("ffffl2c0")j 
Pour la fonction inverse, employez sprintf : 

sprintf "%lx"j $nombre; # (la lettre L en minuscule, pas le chiffre un.) 

Les chames hexadecimales ne peuvent representer que des entiers. Les chames qui cau- 
seraient un debordement de la limite pour les entiers declenchent un avertissement. 

import 

import N0M_CLASSE LISTE 
import NOMCLASSE 

II n'existe pas de fonction import integree. II s'agit essentiellement d'une methode de 
classe ordinaire definie (ou heritee) par les modules qui desirent exporter des noms vers 
un autre module par l'intermediaire de l'operateur use. Voir use pour plus de details. 

index 

index CHAINE, S0US_CHAINE, DECALACE 
index CHAINE, SOUSCHAINE 

Cette fonction recherche une chaine a l'interieur d'une autre. Elle renvoie la position 
de la premiere occurrence de S0US_CHAINE dans CHAINE. Le DECALACE, s'il est specifie, in- 
dique a partir de combien de caractere debute la recherche. Les positions partent de 0 
(ou de la ou vous avez positionne la variable de base des indices $[, mais ne faites pas 
ca). Si la sous-chame n'est pas trouvee, la fonction renvoie un de moins que la base, ge- 
neralement -1. Pour balayer une chaine, on peut ecrire : 

$pos = -l; 

while (($pos = index($chaine, $chaine_recherchee, $pos)) > -l) { 
print "Trouve en $pos\n"; 
$pos++; 

} 

hit B 

int EXPR 
int 

Cette fonction renvoie la partie entiere de EXPR. Si vous etes un programmeur C, vous 
etes susceptible d'oublier frequemment d'utiliser int en conjonction avec la division, 
qui est une operation en virgule f lottante en Perl : 

$age_moyen = 939/16; # donne 58.6875 (58 en C) 
$age_moyen = int 939/16; # donne 58 

Vous ne devez pas employer cette fonction pour arrondir dans tous les cas, car elle tron- 
que vers 0 et parce que la representation pour la machine des nombres en virgule f lot- 
tante peut quelque fois produire des resultats qui ne sont pas intuitifs. Par exemple, 
int(-6. 725/0.025) donnera -268 au lieu de la valeur correcte -269 ; ceci car la valeur 
est plus proche de -268.99999999999994315658. Generalement, les fonctions sprintf, 
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printf ou POSIX: : floor ou encore POSIX: :ceil vous serviront plus que ne leferait int. 

$n = sprintf ("%.0f ", $f); # arrondit (et ne tronque pas) 

# vers l'entier le plus proche 

iocti go @ m m m 

ioctl HANDL E_ FICHIER, FONCTION, SCALAIRE 

Cette fonction implemente l'appel systeme ioctl{2) qui controle les entrees/sorties. II 
vous faudra peut-etre d'abord ecrire pour obtenir les definitions de fonctions correctes : 

require "sys/ioctl.ph"; # probablement /usr/local/lib/perl/sys/ioctl.ph 

Si sys/ioctl.ph n'existe pas ou ne comporte pas les definitions correctes, vous devrez ecrire 
les votres, en vous basant sur vos en-tetes de fichiers C comme sys/ioctl.h. (La distribu- 
tion Perl contient un script appele h2ph pour vous y aider, mais cela reste complexe.) 
SCALAIRE sera lu ou ecrit (ou les deux) selon la FONCTION — un pointeur sur la valeur 
chaine de SCALAIRE sera passe comme troisieme argument de l'appel reel a ioctl{2). (Si 
SCALAIRE n'a pas de valeur chaine, mais une valeur numerique, c'est cette derniere qui 
sera passee directement au lieu d'un pointeur sur la valeur chaine.) Les fonctions pack 
et unpack servent notamment a manipuler les valeurs des structures utilisees par ioctl. 
L'exemple suivant determine combien d'octets sont disponibles pour etre lus en utili- 
sant un FIONREAD : 

require 'sys/ioctl.ph'; 

$taille = pack("L", 0); 
ioctl(HF, FIONREADQ j $taille) 

or die "Impossible d'appeler ioctl : $!\n"; 
$taille = unpack("L", $taille); 

Si h2ph n'a pas ete installe ou ne fonctionne pas dans votre cas, vous pouvez faire un 
grep a la main sur les fichiers d'en-tetes ou ecrire un petit programme C pour afficher 
la valeur. 

La valeur de retour d'ioctl (et de f cntl) est comme suit : 



L'appel systeme renvoie 


Perl renvoie 


-1 


undef. 


0 


La chaine « 0 but true ». 


autre chose 


Le meme nombre. 



Perl renvoie done vrai pour un succes et faux pour un echec, tout en vous laissant faci- 
lement determiner la valeur renvoyee par le systeme d'exploitation : 

$val_ret = ioctl(...) | | -1; 

printf "ioctl a en fait renvoye %d\n", $val_ret; 

La chaine speciale « 0 but true » (N.d.T. : 0 mais vrai) est exempte des avertissements 
de -w a propos des conversions numeriques inadaptees. 

Les appels a ioctl ne doivent pas etre consideres comme portables. Si, par exemple, 
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vous voulez simplement desactiver l'echo une seule fois pour le script tout entier, il est 
beaucoup plus portable d'ecrire : 

system "stty -echo"; # Fonctionne sur la plupart des Unix 

Ce n'est pas parce qu'il est possible de faire quelque chose en Perl qu'il faille le faire. Pour 
citer l'apotre Saint Paul : « Tout est acceptable — mais tout n'est pas benefique. » 

Pour une meilleur portabilite, vous devriez regarder le module de CPAN Term: : Read- 
Key. 

join 

join EXPR, LISTE 

Cette fonction joint les chaines separees de LISTE en une chaine unique dont les champs 
sont separes par la valeur de EXPR, et renvoie la chaine resultante. Par exemple : 

$enreg = join $login J $mot_de_passe,$uid J $gid J $nom_reel,$rep,$shell; 

Pour faire l'inverse, voir split. Pour joindre des elements dans des champs a position 
fixe, voir pack. La maniere la plus efficace de concatener des chaines consiste a les join- 
dre avec la chaine vide : 

$chaine = join "", ^tableau; 

Au contraire de split, join ne prend pas un motif comme premier argument, et elle 
produit un avertissement si vous tentez de le faire. 

keys 

keys HACHAGE 

Cette fonction renvoie une liste constitute de toutes les clefs du HACHAGE indique. Les 
clefs sont renvoyees dans un ordre apparemment aleatoire, mais c'est le meme que celui 
produit par les fonctions values ou each (a supposer que le hachage n'a pas ete modifie 
entre les appels). Comme effet de bord, elle reinitialise l'iterateur de HACHAGE. Voici une 
maniere (un peu tordue) d'afficher votre environnement : 

@clefs = keys %EIW; # les clefs sont dans le meme ordre que 
@valeurs = values %ENV; # les valeurs, comme ceci le demontre 
while (@clefs) { 

print pop(§clefs), '=', pop(@valeurs), "\n"; 

} 

Vous preferez peut-etre plus voir votre environnement affiche dans l'ordre des clefs : 

foreach $clef (sort keys %ENV) { 

print $clef, ' = ', $EN\l{$cle-f}, "\n"; 

} 

Vous pouvez trier les valeurs d'un hachage directement, mais c'est plutot inutile en l'ab- 
sence d'une solution pour retrouver les clefs a partir des valeurs. Pour trier un hachage 
par ses valeurs, vous avez generalement besoin de trier le resultat de keys en fournissant 
une fonction de comparaison qui accede aux valeurs en fonction des clefs. Voici un tri 
numerique decroissant d'un hachage par ses valeurs : 
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foreach $clef (sort { $hachage{$b} <=> $hachage{$a} } keys %hachage) { 
printf "%4d %s\n", $hachage{$clef }, $clef; 

} 

L'utilisation de keys sur un hachage lie a un gros fichier DBM produirait une liste vo- 
lumineuse, et done un processus volumineux. II vaut mieux que vous utilisiez dans ce 
cas la fonction each, qui parcourt les entrees du hachage une a une sans les absorber rou- 
tes dans une seule liste gargantuesque. 

Dans un contexte scalaire, keys renvoie le nombre d'elements du hachage (et reinitiali- 
se l'iterateur de each). Cependant, pour obtenir cette information a partir d'un hachage 
lie, y compris a un fichier DBM, Perl doit le parcourir en entier, ce qui n'est pas tres ef- 
ficace dans ce cas. L'appel de keys dans un contexte vide facilite ceci. 

Utilisee en tant que lvalue, keys augmente le nombre de cellules de hachage (N.d.T. : 
hash buckets) allouees pour le hachage donne. (C'est la meme chose que d'etendre a prio- 
ri un tableau en assignant un nombre eleve pour $#tableau.) Etendre a priori un hacha- 
ge peut se traduire par un gain de performance, s'il vous arrive de savoir si le hachage 
va etre gros, et quelle grosseur il atteindra. Si vous ecrivez : 

keys %hachage = 1000; 

le %hachage aura alors au moins 1000 cellules allouees pour lui (vous aurez en fait 1024 
cellules, puisqu'on arrondit a la prochaine puissance de deux). Vous pouvez diminuer 
le nombre de cellules allouees pour un hachage en utilisant keys de cette maniere (mais 
vous n'aurez pas a vous inquieter de faire cela par accident, puisqu'essayer est sans effet). 
Les cellules seront conservees meme si vous faites %hachage = (). Utilisez undef %ha- 
chage si vous voulez liberer de la place en memoire alors que %hachage est toujours dans 
la portee courante. 

Voir egalement each, value et sort. 

kill m m m m 

kill SIGNAL, LISTE 

Cette fonction envoie un signal a une liste de processus. Pour le SIGNAL, vous pouvez 
utiliser soit un entier, soit le nom d'un signal entre apostrophes (sans le « SIG » au de- 
but). Une tentative d'employer un SIGNAL non-reconnu leve une exception. La fonction 
renvoie le nombre de processus qui ont reussi a recevoir le signal. Si SIGNAL est negatif, 
la fonction touchera des groupes de processus au lieu des processus. (Sur System V un 
numero de processus negatif touchera egalement des groupes de processus, mais ce n'est 
pas portable.) Un PID egal a zero enverra le signal a tous les processus du meme groupe 
que celui de l'emetteur. Par exemple : 

$compt = kill l, $filsi, $fils2; 
kill 9, @mourants; 

kill 'STOP'', getppid # Peut suspendre *ainsi* le shell de login 

unless getppid == -1; # (Mais ne titillez pas init(8).) 

Un SIGNAL valant 0 teste si un processus est toujours en vie et que vous avez toujours les 
permissions pour lui envoyer un signal. Aucun signal n'est envoye. Vous pouvez de cette 
maniere detecter si un processus est toujours en vie et s'il n'a pas change d'UID. 

use Errno qw(ESRCH EPERM); 
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if (kill 0 => $larbin) { 

print "$larbin est en vie !\n"; 
} elsif ($! == EPERM) { # UID change 

print "$larbin a echappe a mon controle !\n"; 
} elsif ($! == ESRCH) { # ou zombie 

print "$larbin est decede.Nn"; 
} else { 

warn "Bizarre : je n'ai pas pu verifier l'etat de $larbin : $!\n"; 

} 

Voir la section Signaux au chapitre 16. 

last m 

last ETIQUETTE 
last 

L'operateur last sort immediatement de la boucle en question, exactement comme 
l'instruction break en C ou en Java (lorsqu'elle est utilisee dans les boucles). Si PF7T- 
QUETTE est omise, l'operateur se refere a la boucle la plus interieure qui l'encadre. Le 
bloc continue, s'il existe, n'est pas execute. 

LIGNE : while (<MSG_MAIL>) { 

last LIGNE if /"%/; # sort lorsqu'on en a fini avec les en-tetes 
# suite de la boucle ici 

} 

last ne peut pas etre employe pour sortir d'un bloc qui renvoie une valeur, comme 
eval {}, sub {}oudo {}, et ne doit pas etre utilise pour sortir d'une operation grep 
ou map. Si les avertissements sont actifs, Perl vous previendra si vous faites un last pour 
sortir d'une boucle qui est hors de votre portee lexicale, comme une boucle dans une 
sous-routine appelante. 

Un bloc en soi-meme est semantiquement identique a une boucle qui ne s'execute 
qu'une seule fois. Ainsi last peut etre employe pour effectuer une sortie anticipee d'un 
tel bloc. 

Voir aussi le chapitre 4 pour des illustrations du fonctionnement de last, next, redo et 
continue. 



lc B0 

lc EXPR 
lc 

Cette fonction renvoie une version en minuscules de EXPR. II s'agit de la fonction inter- 
ne implementant l'echappement \L dans les chaines entre guillemets. La valeur de vo- 
tre locale LC_CTYPE est respectee si use locale est actif, bien que la maniere dont les 
locales interagissent avec Unicode est toujours un sujet a l'etude, comme ils disent. Voir 
la page de man perllocak pour les resultats les plus a jour. 
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lefirst E S 

lcfirst EXPR 
lefirst 

Cette fonction renvoie une version de EXPR avec le premier caractere en minuscule. II 
s'agit de la fonction interne implementant l'echappement \1 dans les chaines entre 
guillemets. La valeur de votre locale LC_CTYPE est respectee si vous employez use loca - 
le et nous tactions de comprendre le rapport avec Unicode. 



length b 

length EXPR 
length 

Cette fonction renvoie la longueur en caracteres de la valeur scalaire de EXPR. Si EXPR 
est omise, la fonction renvoie la longueur de $_ (mais prenez garde que ce qui suit ne 
ressemble pas au debut d'une EXPR ression, faute de quoi le moteur lexical de Perl sera 
perturbe. Par exemple, length < 10 ne compilera pas. En cas de doute, mettez des pa- 
rentheses.) 

N'essayez pas d'utiliser length pour trouver la taille d'un tableau ou d'un liste. scalar 
^tableau donne la taille d'un tableau et scalar keys %hachage celle des couples clef/va- 
leur d'un hachage. (Le scalar est habituellement omis lorsqu'il est redondant.) 

Pour trouver la taille d'une chaine en octets plutot qu'en caracteres, ecrivez : 

$oct_long = do { use bytes; length $chaine; }; 

ou 

$oct_long = bytes: :length $chaine; # doit d'abord faire un use bytes 



link mmm 

link ANCIEN_FICHIER, NOUVEAU_FICHIER 

Cette fonction cree un nouveau nom de fichier lie a l'ancien. La fonction renvoie vrai 
en cas de succes, faux sinon. Voir egalement symlink plus loin dans ce chapitre. II est 
peu probable que cette fonction soit implemented sur les systemes de fichiers non-Unix. 



listen ESS 

listen SOCKET, TAILLE FILE 

Cette fonction informe le systeme que vous allez accepter des connexions sur cette SOC- 
KET et que le systeme peut mettre en file d'attente le nombre de connexions specifiers 
par TAILLE_FILE. Imaginez un signal d'appel sur votre telephone, avec la possibility de 
mettre 17 appels en file d'attente. (Encore faut-il le vouloir !) La fonction renvoie vrai si 
elle a reussi, sinon faux. 

use Socket; 

listen(S0CK_PR0T0, SOMAXCONN) 

or die "Impossible de mettre une file d'attente avec 
listen sur S0CKPR0T0 : $!"; 
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Voir accept. Voir egalement la section Sockets au chapitre 16. Voir listen(2). 

local 

local EXPR 

Cet operateur ne cree pas de variable locale ; utilisez my pour le faire. A la place, il rend 
locales des variables existantes ; c'est-a-dire qu'il donne a une ou plusieurs variables glo- 
bales une portee locale a l'interieur du bloc, de l'eval ou du fichier le plus interieur les 
encadrant. Si plus d'une valeur est listee, la liste doit etre placee entre parentheses car la 
priorite de l'operateur est plus elevee que celle des virgules. Tous les elements listes doi- 
vent etre des lvalues legales, c'est-a-dire quelque chose auquel vous pouvez assigner une 
valeur ; ceci peut comprendre les elements individuels de tableaux ou de hachages. 

Cet operateur fonctionne en sauvegardant les valeurs courantes des variables specifiers 
dans une pile cachee et en les restaurant au moment de sortir du bloc, du sous-program- 
me, de l'eval ou du fichier. Apres que le local a ete execute, mais avant de sortir de sa 
portee, tout sous-programme ou tout format execute verra les valeurs locales internes 
et non les valeurs externes precedentes car la variable reste globale, bien que sa valeur 
soit localisee. Le terme technique est « portee dynamique ». Voir la section Declarations 
avec portee au chapitre 4. 

On peut assigner une valeur a EXPR si besoin, ce qui permet d'initialiser vos variables au 
moment oil vous les rendez locales. Si aucune initialisation explicite n'est effectuee, tous 
les scalaires sont initialises a undef et tous les tableaux et hachages a (). Comme pour 
les affectations ordinaires, si Ton utilise des parentheses autour des variables a gauche 
(ou si la variable est un tableau ou un hachage), l'expression de droite est evaluee dans 
un contexte de liste. Sinon, l'expression de droite est evaluee dans un contexte scalaire. 

Dans tous les cas, l'expression de droite est evaluee avant de rendre les variables locales, 
mais l'initialisation est effectuee apres, vous permettant ainsi d'initialiser une variable 
rendue locale avec la valeur qu'elle contenait avant de l'etre. Par exemple, ce code de- 
montre comment modifier temporairement un tableau global : 

if ($op eq '-v') { 

# initialiser le tableau local avec le tableau global 
local @ARGV = @ARGV; 

unshift @ARGV, 'echo'; 
system @ARGV; 

} 

# @ARGV restaure 

Vous pouvez aussi modifier temporairement des hachages globaux : 

# ajoute temporairement quelques entrees au hachage %chiffres 
if ($basel2) \{ 

# (NB : ce n'est pas forcement efficace !) 
local(%chiffres) = (%chiffres, T => 10, E => ll); 
&parcours_nombres(); 

} 

Vous pouvez utiliser local pour donner des valeurs temporaires aux elements indivi- 
duels de tableaux ou de hachages, meme s'ils ont une portee lexicale : 
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if ($protege) { 

local $SIG{INT} = 'IGNORE'; 

precieux(); # pas d' interruption durant cette fonction 
} # le gestionnaire precedent (s'il y en a) est restaure 

Vous pouvez utiliser local avec les typeglobs pour creer des handles de fichiers locaux 
sans charger des modules objets encombrants : 

local *M0TD; # protege tout handle MOTD global 

my $hf = do { local *HF }; # cree un nouveau handle de fichier indirect 

(Depuis la version 5.6 de Perl, un my $hf ; ordinaire suffit car il vous donne une variable 
indefinie la oil un handle de fichier est attendu, comme le premier argument de open 
ou socket, Perl donne maintenant la vie a un tout nouveau handle de fichier pour 
vous.) 

Mais en general, preferez my au lieu de local, car local n'est pas vraiment ce que la pur- 
part des gens definit comme « local », ni meme « lo-cal ». Voir my. 

localtime 

localtime EXPR 
localtime 

Cette fonction convertit une heure renvoyee par la fonction time en un tableau de neuf 
elements dont l'heure est en phase avec le meridien local. Elle est generalement em- 
ployee comme suit : 

#012 34 5 6 7 8 

($sec , $min, $heure, $mjour, $mois , $annee , $sjour, $a jour, $est_dst) = localtime; 

Si, comme dans ce cas, EXPR est omise, la fonction effectue localtime (time () ). 

Tous les elements sont numeriques et proviennent directement d'une struct tm (un 
jargon de programmation C — pas d'affolement). Cela signifie en particulier que $mois 
se situe dans l'intervalle 0 . . 11 avec janvier comme le mois 0 et que $s jour est dans 0 . . 6 
avec dimanche comme jour 0. Vous pouvez vous rappeler de ceux qui commencent par 
zero car ce sont ceux que vous utilisez toujours comme indices dans les tableaux debu- 
tant par zero contenant les noms des mois et des jours. 

Par exemple, pour obtenir le jour actuel de la semaine : 

$ce_jour = (qw((Dim Lun Mar Mer Deu Ven Sam))[(localtime)[6]]; 

$annee est le nombre d'annees depuis 1900 ; c'est-a-dire qu'en 2023, $annee vaudra 123, 
et pas simplement 23. Pour obtenir l'annee sur 4 chiffres, il suffit d'ecrire $annee+1900. 
Pour l'avoir sur 2 chiffres (par exemple « 01 » en 2001), utilisez sprintf ("%02d", $an- 
nee % 100). 

Le module Time: : Local de la bibliotheque Perl contient un sous-programme, timelo- 
cal, qui peut faire la conversion dans le sens Finverse. 

Dans un contexte scalaire, localtime renvoie une chame ressemblant a ctime(3). Par 
exemple, la commande date{\) peut (presque 6 ) etre emulee par : 



6. date{\) affiche le fuseau horaire, alors que scalar localtime ne le fait pas. 
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perl -le 'print scalar localtime'; 

Voir aussi la fonction strftime du le module standard POSIX pour une approche per- 
mettant de formater des dates avec une granularite plus fine. Le module Time : : local- 
time supporte une interface orientee « par nom » pour cette fonction. 



lock 

lock CHOSE 

La fonction lock place un verrou sur une variable, un sous-programme ou un objet re- 
ference par CHOSE jusqu'a ce que le verrou sorte de la portee courante. Pour assurer une 
compatibilite anterieure, cette fonction n'est interne que si Perl a ete compile en auto- 
risant les threads et si vous avez ecrit use Threads. Sinon, Perl supposera qu'il s'agit 
d'une fonction definie par l'utilisateur. Voir le chapitre 17, Threads. 

log Eg 

log EXPR 
log 

Cette fonction renvoie le logarithms naturel (c'est-a-dire en base e) de EXPR. Si EXPR est 
negative, un exception est levee. Pour obtenir le log dans une autre base, utilisez l'alge- 
bre de base : le log en base-N d'un nombre est egal au log de ce nombre divise par le 
log naturel de N. Par exemple : 

sub logio { 

my $n = shift; 

return log($n)/log(lO); 

} 

Pour l'inverse du log, voir exp. 



Istat gin 

lstat EXPR 
lstat 

Cette fonction est similaire a la fonction stat de Perl (y compris en positionnant le han- 
dle de fichier special _), mais si le dernier composant du nom de fichier est un lien sym- 
bolique, elle agit sur le lien symbolique lui-meme au lieu du fichier sur lequel pointe 
le lien en question. (Si les liens symboliques ne sont pas implemented, c'est un stat nor- 
mal qui est lance en lieu et place.) 



m// am 

/MOTIF/ 
m/MOTIF/ 

II s'agit de l'operateur de correspondance, qui interprete MOTIF comme une expression 
reguliere. L'operateur est evalue comme une chaine entre guillemets plutot que comme 
une fonction. Voir le chapitre 5, Recherche de motif. 
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map 

map BLOC LISTE 
map EXPR, LISTE 

Cette fonction evalue le BLOC ou YEXPR pour chaque element de LISTE (en affectant lo- 
calement $_ a chaque element) et renvoie la liste composee des resultats de chacune de 
ces evaluations. Elle evalue BLOC ou EXPR dans un contexte de liste, ce qui fait que chaque 
element de LISTE peut produire zero, un ou plusieurs elements dans la valeur renvoyee. 
Ces elements sont tous rassembles en une seule liste plate. Par exemple : 

@mots = map { split ' ' } (Slignes; 

eclate une ligne en une liste de mots. Mais on observe souvent une correspondance bi- 
jective entre les valeurs de sortie et d'entree : 

(Scaracteres = map chr, @nombres; 

convertit une liste de nombres vers leurs caracteres correspondants. Voici un exemple 
de correspondance un-vers-deux : 

%hachage = map { gen_clef($_) => $_ } ^tableau; 

qui n'est qu'une facon amusante et fonctionnelle d'ecrire ceci : 

%hachage = (); 

foreach $_ (^tableau) { 

$hachage{gen_clef($_)} = $_; 

} 

Comme $_ est un alias (une reference implicite) pour les valeurs de la liste, on peut uti- 
liser cette variable pour modifier les elements dans le tableau. C'est utile et supporte 
bien que cela puisse generer d'etranges resultats si la LISTE n'est pas un tableau nomme. 
L'utilisation d'une boucle foreach habituelle dans cet objectif peut paraitre plus clair. 
Voir egalement grep ; map differe de grep en ce que map renvoie une liste composee des 
resultats de chaque evaluation successive de EXPR, alors que grep renvoie une liste com- 
posee de chaque valeur de LISTE pour laquelle EXPR est evaluee a vrai. 

mkdir @ m 

mkdir REPERTOIRE, MASQUE 
mkdir REPERTOIRE 

Cette fonction cree le repertoire specifie par REPERTOIRE en lui donnant les permissions 
specifiees par le MASQUE numerique, modifie par le umask courant. Si Foperation reussie, 
elle renvoie vrai, sinon faux. 

Si MASQUE est omis, on suppose un masque de 0777, qui de toute facon est ce que vous 
voulez dans la plupart des cas. En general, creer des repertoires avec un MASQUE permissif 
(comme 0777) et laisser l'utilisateur modifier cela avec son umask est une meilleure ha- 
bitude plutot que de fournir un MASQUE restrictif sans donner a l'utilisateur un moyen 
d'etre plus permissif. L'exception a cette regie est le cas oil le fichier ou le repertoire doit 
rester prive (les fichiers mail, par exemple). Voir umask. 

Si l'appel systeme mkdir(2) n'est pas integre a votre bibliotheque C, Perl l'emule en ap- 
pelant le programme mkdir{\). Pour creer une longue liste de repertoires sur ce genre 
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de systeme, il sera plus efficace d'appeler vous-memes le programme mkdir avec la liste 
des repertoires pour eviter de creer des palanquees de sous-processus. 



msgctl go s 

msgctl ID, CMD, ARC 

Cette fonction invoque l'appel system msgctl{2) des IPC System V ; voir msgctl{2) pour 
plus de details. II se peut que vous deviez faire un use IPC : : SysV pour obtenir les defi- 
nitions de constante correctes. Si CMD vaut IPC_STAT, ARC doit alors etre une variable qui 
contiendra la structure C msqid_ds renvoyee. Les valeurs de retour fonctionnent com- 
me celles de ioctl et f cntl : undef pour une erreur, « 0 but true » (N.d.T. : 0 mais vrai) 
pour zero ou la valeur reelle dans les autres cas. 

Cette fonction n'est disponible que sur les machines qui supportent les IPC System V ce 
qui s'avere bien plus rare que celles qui supportent les sockets. 



msgget no m 

msgget CLEF, FLAGS 

Cette fonction invoque l'appel systeme msgget(2) des IPC System V Voir msgget{2) pour 
plus de details. La fonction renvoie FID de file de messages ou undef s'il y a une erreur. 
Avant d'appeler, vous devez ecrire use IPC: : SysV. 

Cette fonction n'est disponible que sur les machines qui supportent les IPC System V 



msgrcv no DO 

msgrcv ID, VAR, TAILLE, TYPE, FLAGS 

Cette fonction invoque l'appel systeme msgrcv{2) des IPC System V pour recevoir un 
message depuis la file de messages ID dans la variable VAR avec une taille maximum 
TAILLE. Voir msgrcv(2) pour plus de details. Lorsqu'un message est recu, le type de mes- 
sage sera la premiere chose dans VAR et la longueur maximale de VAR sera TAILLE plus la 
taille du type de message. La fonction renvoie vrai si elle reussit ou undef s'il y a une 
erreur. Avant d'appeler, vous devez ecrire use IPC: :SysV. 

Cette fonction n'est disponible que sur les machines qui supportent les IPC System V 



msgsnd @ DD 

msgsnd ID, MSG, FLAGS 

Cette fonction invoque l'appel systeme msgsnd{2) des IPC System V pour envoyer le 
message MSG dans la file de messages ID. Voir msgsnd(2) pour plus de details. MSG doit 
commencer par l'entier long representant le type de message. Vous pouvez creer un 
message comme ceci : 

$msg = pack "L a*", $type, $texte_du_message; 

La fonction renvoie vrai si elle reussit ou undef s'il y a une erreur. Avant d'appeler, vous 
devez ecrire use IPC: :SysV. 

Cette fonction n'est disponible que sur les machines qui supportent les IPC System V 
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my 

my TYPE EXPR : ATTRIBUTS 
my EXPR : ATTRIBUTS 
my TYPE EXPR 
my EXPR 

Cet operateur declare une ou plusieurs variables privees comme n'existant que dans le 
bloc, le sous-programme, l'eval ou le fichier le plus interieur les encadrant. Si plus 
d'une valeur est listee, la liste doit etre placee entre parentheses, car l'operateur lie plus 
fortement que la virgule. Seuls les scalaires simples ou les tableaux et les hachages com- 
plets peuvent etre declares de cette facon. 

Le nom de la variable ne peut pas etre qualifie par un paquetage, car les variables de 
paquetage sont toutes globalement accessibles par le biais de leur table de symboles cor- 
respondante tandis que les variables lexicales sont sans rapport avec une quelconque ta- 
ble de symboles. A Finverse de local, cet operateur n'a rien a voir avec les variables 
globales, sinon masquer une autre variable du meme nom dans sa portee (c'est-a-dire, 
la ou la variable privee existe). Cependant, une variable globale peut toujours etre at- 
teinte sous sa forme qualifiee par paquetage ou par le biais d'une reference symbolique. 

La portee d'une variable privee ne commence pas avant l'instruction qui suit sa declara- 
tion. Elle s'etend a n'importe quel bloc contenu ensuite, jusqu'a la fin de la portee de 
la variable elle-meme. 

Cela signifie cependant que tout sous-programme que vous appelez dans la portee 
d'une variable privee ne peut pas la voir, a moins que le bloc qui definit le sous-pro- 
gramme lui-meme ne fasse textuellement partie de la portee de cette variable. Le terme 
technique consacre est portee lexicale, nous les appelons done souvent variables lexicales. 
Dans la culture C, elles sont appelees variables auto, car elles sont automatiquement al- 
louees et desallouees respectivement a l'entree et a la sortie de la portee. 

Vous pouvez si besoin assigner une valeur a EXPR, ce qui vous permet d'initialiser les va- 
riables locales. (Si aucune initialisation explicite n'est effectuee, tous les scalaires sont 
initialises a la valeur indefinie et tous les tableaux et hachages a la liste vide). Comme 
pour les affectations ordinaires, si Ton utilise des parentheses autour des variables a gau- 
che (ou si la variable est un tableau ou un hachage), l'expression de droite est evaluee 
dans un contexte de liste. Sinon, l'expression de droite est evaluee dans un contexte sca- 
lane. Par exemple, les parametres formels de sous-programme peuvent etre nommes 
par une affectation de liste, comme ceci : 

my ($amis, $romains, $paysans) = @_; 

Mais prenez garde a ne pas oublier les parentheses indiquant une affectation de liste, 
comme ceci : 

my $pays = @_; # Est-ce correct ou pas ? 

Ici, e'est la longueur du tableau (c'est-a-dire le nombre d'arguments du sous-program- 
me) qui est assignee a la variable, car le tableau est evalue dans un contexte scalaire. 
Vous pouvez cependant employer l'affectation scalaire pour un parametre formel, tant 
que vous utilisez l'operateur shift. En fait, comme les methodes sont passees aux objets 
dans le premier argument, de nombreux sous-programmes methodes commencent 
comme ceci : 
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sub simple_comme { 

my $obj = shift; # affectation scalaire 
my ($a,$b,$c) = @_; # affectation de liste 

} 

Si vous tentez de declarer un sous-programme de portee lexicale avec my sub, Perl 
mourra avec le message que cette fonctionnalite n'a pas encore ete implementee. (Sauf 
si bien sur, cette fonctionnalite a deja ete implements. ) 

Les TYPE etATTRIBUTS sont optionnels, ce qui se justifie puisqu'ils doivent tous deux etre 
considered comme experimentaux. Voici a quoi ressemble une declaration qui les 
utilise : 

my Chien $medor :oreilles(courtes) :queue(longue); 

Le TYPE, s'il est specifie, indique quelle sorte de scalaire ou de scalaires sont declares dans 
EXPR, soit directement comme une ou plusieurs variables scalaires, soit indirectement 
par le biais d'un tableau ou d'un hachage. Si TYPE est le nom d'une classe, on supposera 
que les scalaires contiennent des references a des objets de ce type, ou a des objets com- 
patibles avec ce type. En particulier, les classes derivees sont considerees comme compa- 
tibles. C'est-a-dire, en supposant que Colley soit derivee de Chien, vous pouvez 
declarer : 

my Chien $lassie = new Colley; 

Votre declaration affiche que vous desirez utiliser Fobjet $lassie en accord avec son ap- 
partenance a un objet Chien. Le fait que ce soit vraiment un objet Colley ne doit pas 
avoir d'inf luence tant que vous vous lui faites faire des choses de Chien. Malgre la magie 
des methodes virtuelles, l'implementation de ces methodes de Chien peuvent tres bien 
etre dans la classe Colley, mais la declaration ci-dessus ne parle que de l'interface et pas 
de l'implementation. En theorie. 

De maniere interessante, dans la version 5.6.0, la seule fois oil Perl accorde une atten- 
tion a la declaration de TYPE est lorsque la classe correspondante a declare des champs 
avec le pragma use fields. Prises ensembles, ces declarations permettent a l'implemen- 
tation d'une classe en tant que pseudo-hachage de « s'exhiber » au code qui se trouve a 
l'exterieur de la classe, permettant ainsi aux recherches dans le hachage d'etre optimi- 
sees par le compilateur comme etant des recherches dans un tableau. En un sens, le 
pseudo-hachage est l'interface pour une telle classe, notre theorie reste done intacte, si 
ce n'est un peu cabossee. Pour plus d'informations sur les pseudo-hachages, voir la sec- 
tion Pseudo-hachages au chapitre 8, References. 

A l'avenir, d'autres types de classes pourront interpreter le TYPE differemment. La decla- 
ration de TYPE doit etre percue comme une interface de type generique qui pourra un 
jour etre instanciee de differentes manieres selon la classe. En fait, le TYPE pourra meme 
ne pas etre un nom de classe officiel. Nous reservons les noms de types en minuscules 
pour Perl, car l'une des manieres que nous preferons pour etendre le type d'interface 
est d'autoriser les declarations de type de bas niveau comme int, num, str et ref. Ces 
declarations ne seront pas destinees a un typage fort ; elles seront plutot des indications 
pour le compilateur, en lui disant d'optimiser le stockage de la variable en supposant 
que cette variable sera le plus souvent utilisee comme elle a ete declaree. La semantique 
des scalaires restera a peu pres la meme — vous serez toujours capables d'additionner 
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deux scalaires str (N.d.T. : chames) ou d'afficher un scalaire int (N.d.T. : entier), exacte- 
ment comme s'ils etaient les scalaires polymorphes auxquels vous etes familiers. Mais 
avec une declaration int, Perl pourra decider de ne stacker que la valeur entiere et 
d'oublier de sauver dans le cache la chaine resultante comme il le fait actuellement. Les 
boucles avec des variables de boucle int pourront tourner plus rapidement, speciale- 
ment dans le code compile en C. Les tableaux de nombres pourront en particulier etre 
stockes de maniere plus compacte. Comme cas limite, la fonction interne vec deviendra 
meme obsolete alors que nous pourrons ecrire des declarations comme : 

my bit @chaine_de_bits; 

La declaration ATTRIBUTS est encore plus experimentale. Nous n'avons pas fait grand 
chose de plus que reserver la syntaxe et prototyper l'interface interne ; voir le pragma 
use attributes au chapitre 31 pour plus d'informations a ce sujet. Le premier attribut 
que nous implementerons est susceptible d'etre constant : 

my num $PI : constant = atan2(l,l) * 4; 

Mais il y a beaucoup d'autres possibilites, comme etablir des valeurs par defaut pour les 
tableaux et les hachages ou laisser les variables partagees entre des interpreters coope- 
rant. Comme l'interface de type, l'interface d'attribut doit etre percue comme une in- 
terface generique, une sorte de cadre de travail pour inventer de nouvelles syntaxes et 
semantiques. Nous ne savons pas comment Perl evoluera dans les dix prochaines an- 
nees. Nous savons seulement que nous pouvons le rendre plus simple pour nous-me- 
mes en planifiant cela a l'avance. 

Voir egalement local, our et la section Declarations avec portee au chapitre 4. 

new 

new NOM_CLASSE LISTE 
new NOMCLASSE 

II n'existe pas de fonction interne new. II s'agit plutot d'un constructeur de methode or- 
dinaire (c'est-a-dire un sous-programme defini par l'utilisateur) qui est defini ou herite 
par la classe NOM_CLASSE (c'est-a-dire le paquetage) pour vous laisser construire des ob- 
jets de type NOM_CLASSE. Beaucoup de constructeurs sont appeles « new », mais seule- 
ment par convention, juste pour jouer un tour aux programmeurs C++ en leur faisant 
croire qu'ils savent ce qu'il se passe. Lisez toujours la documentation de la classe en ques- 
tion pour savoir comment appeler ses constructeurs ; par exemple, le constructeur qui 
cree une « list box » dans le widget Tk est juste appele ListboxQ. Voir le chapitre 12. 

next m 

next ETIQUETTE 
next 

L'operateur next est semblable a l'instruction continue en C ; il demarre l'iteration sui- 
vante de la boucle designee par ETIQUETTE : 

LIGNE: while (<STDIN>) { 

next LIGNE if / A #/; # elimine les commentaires 



} 
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S'il y avait un bloc continue dans cet exemple, il s'executerait immediatement apres Fin- 
vocation de next. Lorsqu' ETIQUETTE est omise, la commande se refere a la boucle la plus 
interieure l'encadrant. 

Un bloc en soi-meme est semantiquement identique a une boucle qui ne s'execute 
qu'une seule fois. Ainsi next peut quitter de maniere anticipee un tel bloc (via le bloc 
continue, s'il y en a un). 

next ne peut pas etre employe pour sortir d'un bloc qui renvoie une valeur, comme 
eval {}, sub {}oudo {}, et ne doit pas etre utilise pour sortir d'une operation grep 
ou map. Si les avertissements sont actifs, Perl vous previendra si vous faites un next pour 
sortir d'une boucle qui est hors de votre portee lexicale, comme une boucle dans une 
sous-routine appelante. Voir la section Instructions de boucle au chapitre 4. 

no m 

no MODULE LISTE 

Voir l'operateur use, qui est l'inverse de no, plus ou moins. La plupart des modules stan- 
dard ne « non-importent » rien, faisant de no une « non-operation ». Les modules prag- 
matiques ont tendance ici a etre plus serviables. Si le MODULE n'est pas trouve, une 
exception est levee. 



oct E 

oct EXPR 
oct 

Cette fonction interprete EXPR comme une chame octale et renvoie la valeur decimale 
equivalente. S'il se trouve que EXPR commence par « Ox », on l'interprete comme une 
chame hexadecimale a la place. Si EXPR debute par « Ob », on l'interprete comme une 
chame de chiffres binaires. Ce qui suit convertit proprement en nombres n'importe 
quelle chame en base decimale, binaire, octale ou hexadecimale dans la notation stan- 
dard C ou C++ : 

$val = oct $val id $val =~ / A 0/; 

Pour executer la fonction inverse, utilisez sprintf avec le format approprie : 

$perms = (stat("nom_fichier")) [2] & 07777; 
$perms_oct = sprintf "%lo", $perms; 

La fonction oct est habituellement employee lorsqu'une donnee sous forme de chame, 
comme « 644 » doit etre convertie vers un mode de fichier, par exemple. Bien que Perl 
convertisse automatiquement les chaines en nombres si besoin est, cette conversion 
automatique suppose que Ton soit en base 10. 



open m \m m m 

open HANDLE_FICHIER, MODE, LISTE 
open HANDL E_ FICHIER, EXPR 
open HANDL E_ FICHIER 

La fonction open associe un HANDLE_FICHIER interne a la specification d'un fichier ex- 
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terne donnee par EXPR ou LISTE. Elle peut etre appelee avec un, deux ou trois argu- 
ments (ou plus si le troisieme argument est une commande et que vous lancez au moins 
la version 5.6.1 de Perl). Si trois arguments ou plus sont presents, le deuxieme argument 
specifie le MODE d'acces avec lequel le fichier doit etre ouvert, et le troisieme argument 
(LISTE) fournit le veritable nom de fichier ou la commande a executer, en fonction du 
MODE. Dans le cas d'une commande, des arguments supplementaires peuvent etre four- 
nis si vous desirez invoquer la commande directement sans impliquer un shell, un peu 
comme system ou exec. Sinon, la commande peut etre fournie comme un seul argu- 
ment (le troisieme), auquel cas la decision d'invoquer le shell depend du fait que la com- 
mande contienne ou non des metacaracteres du shell. (N'utilisez pas plus de trois 
arguments si les arguments sont des fichiers ordinaires ; cela ne fonctionnera pas.) Si le 
MODE n'est pas reconnu, open leve une exception. 

Si seulement deux arguments sont presents, on suppose que le mode et le nom de fi- 
chier ou de commande sont assembles dans le second argument. (Et si vous ne specifiez 
aucun mode dans le second argument mais uniquement un nom de fichier, le fichier 
est alors ouvert en lecture seule pour raison de securite.) 

Avec un seul argument, la variable scalaire de paquetage qui porte le meme nom (la va- 
riable, pas le paquetage !) que le HANDLE_FICHIER, doit contenir le nom du fichier et le 
mode optionnel : 

$L0G = ">fichier_journal"; # $L0G ne doit pas etre declaree avec my ! 
open LOG or die "Impossible d'ouvrir le fichier journal : $!"; 

Mais ne faites pas cela ! Qa manque de style. Oubliez que nous en avons parle. 

La fonction open renvoie vrai si elle reussit, sinon undef. Si le open commence par un 
pipe sur un processus fils, la valeur de retour sera le PID de ce nouveau processus. Com- 
me avec tout appel systeme, verifiez toujours la valeur de retour de open pour etre sur 
qu'il a marche. Mais ce n'est pas du C ou du Java, alors n'employez pas d'instruction if 
alors que l'operateur or fait tres bien l'affaire. Vous pouvez egalement employer 1 1 , 
mais dans ce cas, utilisez des parentheses autour du open. Si vous choisissez d'omettre 
les parentheses autour de l'appel de fonction pour le changer en operateur de liste, pre- 
nez garde a bien utiliser « or die » apres la liste plutot que « | | die », car la preseance 
de | | est superieure a celle des operateurs de liste comme open, et le | | serait lie a votre 
dernier argument et non a l'open tout entier : 

open LOG, ">f ichier_journal" 

| die "Impossible de creer le fichier journal : $!"; # FAUX 
open LOG, ">f ichier_journal" 

or die "Impossible de creer le fichier journal : $!"; # ok 

Cela semble plutot exagere, mais generalement vous devriez inserer un quelconque ca- 
ractere d'espacement pour que la fin de l'operateur de liste vous saute aux yeux : 

open LOG, ">f ichier_journal" 

or die "Impossible de creer le fichier journal : $!"; 

Comme le montre cet exemple, l'argument HANDLE_FICHIER n'est souvent qu'un simple 
identificateur (normalement en majuscules), mais il peut aussi etre une expression dont 
la valeur donne une reference vers le veritable handle de fichier. (La reference peut etre 
soit une reference symbolique vers le nom du handle de fichier, soit une reference en 
dur vers tout objet qui puisse etre interprete comme un handle de fichier.) On appelle 
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ceci un handle defichier indirect, et toute fonction qui prend comme premier argument 
un HANDLE _FICHIER accepte les handles de fichiers aussi bien indirects que directs. Mais 
open est special, car si vous lui donnez une variable indefinie comme handle de fichier 
indirect, Perl definira automatiquement cette variable pour vous, c'est-a-dire qu'elle 
sera autovivifiee pour contenir la reference de handle de fichier adequat. Ceci a l'avan- 
tage de fermer automatiquement le handle de fichier lorsqu'il n'y a plus de reference 
sur lui, generalement lorsque la variable quitte la portee courante : 

{ 

my $hf; # (non initialised) 

open($hf, ">fichier_journal") # $hf est autovivifie 

or die "Impossible de creer le fichier journal : $!"; 

# faites ce que vous voulez avec $hf 
} # fermeture de $hf ici 

On peut lisiblement incorporer la declaration my $hf a l'interieur de l'open : 

open my $hf, ">f ichierjournal" or die 

Le symbole > que vous venez de voir devant le nom de fichier est un exemple de mode. 
Historiquement, la forme avec deux arguments de open est apparue en premier. Le re- 
cent ajout de la forme avec trois arguments vous permet de separer le mode du nom de 
fichier, qui a Favantage d'eviter toute confusion possible entre les deux. Dans l'exemple 
suivant, nous savons que l'utilisateur n'essaie pas d'ouvrir un nom de fichier commen- 
cant par « > ». Nous pouvons etre surs qu'il specifie un MODE valant « > », ce qui ouvre 
en ecriture le fichier indique par EXPR, en le creant s'il n'existait pas et en l'effacant s'il 
existait deja : 

open(L0G, ">", "fichier journal") 

or die "Impossible de creer le fichier journal : $!"; 

Dans les formes plus courtes, le nom de fichier et le mode se trouvent dans la meme 
chame. La chaine est analysee un peu comme un shell typique traite les redirections de 
fichiers et de pipes. La chaine est alors examinee, par n'importe quelle extremite si be- 
som, pour trouver les caracteres specifiant comment le fichier doit etre ouvert. Un es- 
pace est autorise entre le mode et le nom de fichier. 

Les modes qui indiquent comment ouvrir un fichier ressemblent aux symboles de redi- 
rection du shell. Le tableau 29-1 donne une liste de ces symboles. (Pour acceder a un fi- 
chier en combinant des modes d'ouvertures non presentes dans cette table, voir la 
fonction de bas niveau sysopen.) 



Tableau 29-1. Modes pour open 



Mode 


Acces en 
lecture 


Acces en 
ecriture 


Ajout 

uniquement 


Creer si 
inexistant 


Vidage de 
l'existant 


< CHEMIN 


O 


N 


N 


N 


N 


> CHEMIN 


N 


O 


N 


O 


O 


» CHEMIN 


N 


O 


O 


O 


N 


+< CHEMIN 


O 


o 


N 


N 


N 


+> CHEMIN 


O 


o 


N 


O 


O 


+» CHEMIN 


o 


o 


O 


O 


N 
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Tableau 29-1. Modes pour open 



Mode 


Acces en 
lecture 


Acces en 
ecriture 


Ajout 

uniquement 


Creer si 
inexistant 


Vidage de 
l'existant 


| COMMANDE 


N 


O 


aucun 


aucun 


aucun 


COMMANDE \ 


O 


N 


aucun 


aucun 


aucun 



Si le mode est « < » ou rien du tout, un fichier existant est ouvert en lecture. Si le mode 
est « > », le fichier est ouvert en ecriture, ce qui tronque les fichiers existants et cree ceux 
qui n'existent pas. Si le mode est « >> », le fichier est cree si besoin et ouvert en ajout, 
et toutes les ecritures sont automatiquement placees a la fin du fichier. Si un nouveau 
fichier est cree parce que vous avez utilise « > » ou « >> » et que le fichier n'existait pas 
auparavant, les permissions d'acces dependront de l'umask actuel du processus avec les 
regies decrites pour cette fonction. Voici quelques exemples courants : 

open (INFO, "fichier_de_donnees") 

| die ("Impossible d'ouvrir le fichier de donnees : $!"); 
open(INF0, "< f ichier_de_donnees") 

| die("Impossible d'ouvrir le fichier de donnees : $!"); 
open(RESULTATS, "> stats_en_cours") 

| die("Impossible d'ouvrir les stats en cours : $!"); 
open(L0G, ">> f ichier_journal") 

| die("Impossible d'ouvrir le fichier journal : $!"); 

Si vous preferez la version avec moins de ponctuation, vous pouvez ecrire : 

open INFO, "f ichier_de_donnees" 

or die("Impossible d'ouvrir le fichier de donnees : $!"); 
open INFO, "< fichier_de_donnees" 

or die("Impossible d'ouvrir le fichier de donnees : $!"); 
open RESULTATS, "> stats_en_cours" 

or die("Impossible d'ouvrir les stats en cours : $!"); 
open LOG, ">> fichier_journal" 

or die("Impossible d'ouvrir le fichier journal : $!"); 

Lors d'une ouverture en lecture, le nom de fichier special « - » se refere a STDIN. Lors- 
qu'il est ouvert en ecriture, ce meme nom de fichier special se refere a STDOUT. Norma- 
lement, on les specifie respectivement avec « <- » et « -> ». 

open(ENTREE, "-" ) or die; # rouvre l'entree standard en lecture 

open(ENTREE, "<-") or die; # idem mais explicitement 

open(SORTIE, "->") or die; # rouvre la sortie standard en ecriture 

De cette facon, l'utilisateur peut fournir a un programme un nom de fichier qui utilise- 
ra l'entree ou la sortie standard, mais Fauteur du programme n'a pas besoin d'ecrire de 
code particulier pour connaitre ceci. 

Vous pouvez egalement placer un «»+«» devant n'importe lequel de ces trois modes 
pour demander un acces en lecture/ecriture simultane. Cependant, le fait que le fichier 
soit vide ou cree et qu'il doit deja exister est toujours determine par votre choix du signe 
inferieur ou superieur. Cela signifie que « +< » est toujours un meilleur choix pour des 
mises a jour en lecture/ecriture, plutot que le mode douteux « +> » qui viderait tout 
d'abord le fichier avant que vous puissiez y lire quoique ce soit. (N'utilisez ce mode que 
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si vous ne voulez relire que ce que vous venez d'ecrire.) 

open(DBASE, "+<base_de_donnees") 

or die "Impossible d'ouvrir la base de donnees en mise a jour : $!"; 

Vous pouvez traiter un fichier ouvert en mise a jour comme une base de donnees en 
acces direct et utiliser seek pour vous deplacer vers un nombre d'octets particulier, mais 
les enregistrements de longueur variable rendent generalement irrealisables l'emploi 
du mode lecture/ecriture pour mettre a jour de tels fichiers. Voir l'option de la ligne de 
commande -i au chapitre 19 pour une approche differente des mises a jour. 

Si le premier caractere dans EXPR est un symbole pipe, open declenche un nouveau pro- 
cessus et connecte un handle de fichier en ecriture seule avec la commande. De cette fa- 
con, vous pouvez ecrire dans ce handle et ce que vous y ecrivez sera passe a l'entree 
standard de cette commande. Par exemple : 

open(IMPRIMANTEj "| lpr -Plpl) or die "Impossible de forker : $!"; 
print IMPRIMANTE "truc\n"; 

close(IMPRIMANTE) or die "Echec de la fermeture de lpr : $?/$!"; 

Si le dernier caractere de EXPR est un symbole pipe, open lancera ici aussi un nouveau 
processus, mais cette fois connecte a un handle de fichier en lecture seule. Ceci permet 
a tout ce que la commande ecrit sur sa sortie standard d'etre passe dans votre handle 
pour etre lu. Par exemple : 

open(RESEAUj "netstat -i -n |") or die "Impossible de forker : $!"; 
while (<RESEAU>) { ... } 

close RESEAU or die "Impossible de fermer netstat : $!/$?"; 

La fermeture explicite de tout handle de fichier pipe entrame l'attente du processus pere 
de la terminaison du processus fils et le retour d'un code de statut dans $? 
($CHILD_ERROR). II est egalement possible que close positionne $ ! ($0S_ERR0R). Voir les 
exemples dans les descriptions de close et de system pour savoir comment interpreter 
ces codes d'erreur. 

Toute commande pipee contenant des metacaracteres shell comme des jokers (N.d.T. : 
wildcards) ou des redirections d'entree/sortie est passee a votre shell canonique (Jbin/sh 
sur Unix), ces constructions specifiques au shell sont done analysees en premier lieu. Si 
aucun metacaractere n'est trouve, Perl lance le nouveau processus lui-meme sans appe- 
ler le shell. 

Vous pouvez egalement utiliser la forme a trois arguments pour demarrer des pipes. En 
utilisant ce style, l'equivalent des ouvertures de pipe precedentes serait : 

open(IMPRIMANTEj "|-", "lpr -Plpl") or die "Impossible de forker : $!"; 
open(RESEAU, "-|", "netstat -i -n") or die "Impossible de forker : $!"; 

Ici le caractere moins dans le deuxieme argument represente la commande du troisieme 
argument. Ces commandes n'invoquent pas le shell, mais si vous souhaitez qu'aucun 
traitement du shell ne survienne, les nouvelles versions de Perl vous permettent 
d'ecrire : 

open(IMPRIMANTEj "|-", "lpr", "-Plpl") 

or die "Impossible de forker : $!"; 
open(RESEAU, "netstat", "-i", "-n") 

or die "Impossible de forker : $!"; 



712 



Chapitre 29 — Fonctions 



Si vous utilisez la forme a deux arguments pour ouvrir un pipe ou la commande specia- 
le « - » 7 , un fork implicite est realise en premier lieu. (Sur les systeme qui ne savent pas 
forker, ceci leve une exception. Les systemes Microsoft ne supportaient pas le fork 
avant la version 5.6 de Perl.) Dans ce cas, le caractere moins represente votre nouveau 
processus fils, qui est une copie du pere. La valeur de retour de cet open forkant est l'ID 
du processus fils lorsqu'elle est examinee par le pere, 0 lorsque c'est par le fils et la valeur 
indefinie undef si le fork echoue — auquel cas, il n'y a pas de fils. Par exemple : 

defined ($pid = open(DEPUIS_LE_FILS, "-|")) 
or die "Impossible de forker : $!"; 

if ($pid) { 

@lignes_pere = <DEPUIS_LE_FILS>; # code du pere 
} else { 

print STDOUT (5)lignes_fils; # code du fils 

} 

Le handle de fichier se comporte normalement pour le pere, mais pour le processus fils, 
l'entree (ou la sortie) du pere est pipee depuis (ou vers) le STDOUT (ou le STDIN) du fils. 
Le processus fils ne voit pas le handle de fichier du pere comme etant ouvert. (Ceci est 
utilement indique par le PID de 0.) 

Generalement vous devriez utiliser cette construction a la place d'un open pipe classique 
lorsque vous voulez exercer plus de controle sur la maniere dont la commande pipee 
s'execute (comme lorsque vous executez setuid) et que vous ne desirez pas examiner si 
les commandes shells contiennent des metacaracteres. Les open pipes suivant sont forte- 
ment equivalents : 

open HF, "| tr 'a-z' 'A-Z'"; # pipe vers une commande shell 

open HF, "|-", 'tr', 'a-z', 'A-Z'; # pipe vers une commande nue 

open HF, "|-" or exec 'tr', 'a-z', ' A-Z' or die; # pipe vers un fils 

tout comme celles-ci : 

open HF, " cat -n 'fichier' |"; # pipe vers une commande shell 

open HF, "-|", 'cat', '-n' 'fichier'; # pipe vers une commande nue 

open HF, "-|" or exec 'cat', '-n', 'fichier' or die; # pipe vers un fils 

Pour des utilisations plus elaborees de open forke, voir la section Soliloque au chapitre 
16 et Nettoyage de votre environnement au chapitre 23, Securite. 

Lorsque vous demarrez une commande avec open, vous devez choisir soit l'entree soit 
la sortie : « cmd | » pour la lecture ou « | cmd » pour l'ecriture. Vous ne pouvez pas uti- 
lisez open pour demarrer une commande qui possedent des pipes a la fois en entree et 
en sortie, comme la notation illegale (pour le moment) « | cmd | » semblerait l'indiquer. 
Cependant, les routines standard de la bibliotheque IPC: :0pen2 et IPC: :0pen3 vous 
donne une equivalence relativement proche. Pour plus de detail sur les pipes a double 
sens, voir la section Communication bidirectionnelle au chapitre 16. 

Vous pouvez egalement specifier, dans la plus pure tradition du Bourne Shell, une EXPR 
commencant par >&, auquel cas le reste de la chaine est interprets comme le nom d'un 



7. Ou vous pouvez la considerer comme la porte de sortie de la commande des formes a trois 
arguments ci-dessus. 
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handle de fichier (ou un descripteur de fichier, s'il est numerique) que Ton doit dupli- 
quer en utilisant Fappel systeme dup2(2). 8 Vous pouvez utiliser & apres >, >>, +>, +>> et 
+<. (Le mode specifie doit correspondre au mode du handle de fichier originel.) 

Une raison pour laquelle vous pourriez vouloir faire cela serait le cas ou vous disposiez 
d'ores et deja un handle de fichier ouvert et que vous vouliez obtenir un autre handle 
de fichier qui soit reellement un duplicata du premier. 

open(SORTIE_SAUVEE, " >&ERREUR_SAUVEE " ) 

or die "Impossible de dupliquer ERREURSAUVEE : $!"; 
open(MOI\l_CONTEXTE, "<&4") 

or die "Impossible de dupliquer le descfic4 : $!" ; 

Cela signifie que si une fonction attend un nom de fichier, mais si vous ne voulez pas lui 
en donner parce que vous disposez deja d'un fichier ouvert, vous n'avez qu'a passer le 
handle de fichier prefixe par une esperluette. II vaut mieux tout de meme utiliser un han- 
dle pleinement qualifie, pour le cas oil la fonction se trouve dans un autre paquetage : 

une_fonction("&main: : FICHIERDOURNAL"); 

Une autre raison de dupliquer un handle de fichier est de rediriger temporairement un 
handle de fichier existant sans perdre la trace de la destination d'origine. Voici un script 
qui sauvegarde, redirige et restaure STDOUT et STDERR : 

#!/usr/bin/perl 

open SORTIE_SAUVEE, ">&STD0UT"; 
open ERREUR_SAUVEE, ">&STDERR"; 

open STDOUT, ">truc.out" or die "Impossible de rediriger stdout"; 
open STDERR, ">&STD0UT" or die "Impossible de dupliquer stdout"; 



select STDERR; $| = 1; 
select STDOUT; $| = 1; 



# active le vidage de tampon automatique 

# active le vidage de tampon automatique 



print STDOUT "stdout l\n"; # ces flux d'entree/sortie se propagent 
print STDERR "stderr l\n"; # egalement aux sous-processus 
system ("une commande"); # utilise les nouveaux stdout/stderr 

close STDOUT; 
close STDERR; 

open STDOUT, ">&SORTIE_SAUVEE"; 
open STDERR, ">&ERREUR_SAUVEE"; 



print STDOUT "stdout 2\n"; 
print STDERR "stderr 2\n"; 

Si le handle ou le descripteur de fichier est precede par une combinaison &= au lieu d'un 
simple &, alors au lieu de cree un descripteur de fichier completement neuf, Perl fait de 



8. Cela ne fonctionne pas (pour le moment) avec les objets d'entree/sortie sur les references de 
typeglobs par autovivification, mais vous pouvez toujours employer f ileno pour aller chercher 
le descripteur de fichier et le dupliquer. 
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HANDLE _FICHIER un alias du descripteur existant en utilisant l'appel/dopen(3) de la bi- 
bliotheque C. Ceci est quelque peu plus parcimonieux en terme de ressources systeme, 
bien que ce ne soit plus un gros probleme de nos jours. 

$df = $ENV{"DF_MON_CONTEXTE}; 
open (M0N_C0NTEXTE , "<&=$num_df" 

or die "fdopen sur le descripteur $num_fd impossible : $!\"; 

Les handles de fichiers STDIN, STDOUT et STDERR restent toujours ouvert a travers un 
exec. Les autres handles de fichiers ne le restent pas, par defaut. Sur les systemes qui sup- 
portent la fonction fcntl, vous pouvez modifiez le flag close-on-exec (N.d.T. : indica- 
teur de fermeture lors d'un exec) pour un handle de fichier : 

use Fcntl qw(F_GETFD F_SETFD); 
$flags = fcntl(HF, FSETFD, 0) 

or die "Impossible de nettoyer le flag close-on-exec pour HF : $!\n"; 

Voir aussi la variable speciale $ A F ($SYSTEM_MAX_FD) au chapitre 28. 

Avec les formes a un ou a deux arguments de open, vous devez faire attention lorsque 
vous utilisez une variable chaine comme nom de fichier, puisque la variable peut con- 
tenir arbitrairement des caracteres etranges (particulierement lorsque le nom du fichier 
a ete obtenu a partir d' etranges caracteres depuis Internet). Si vous n'y prenez pas garde, 
certaines parties du nom de fichier peuvent etre interpreters comme une chaine de 
MODE , des espaces a ignorer, une specification de duplication ou un signe moins. Voici 
une maniere historiquement interessante de vous isoler : 

$chemin =~ s# A (\s)#. 

open (HF, "< $chemin\0") or die "Impossible d'ouvrir $chemin : $!"; 

Mais vous etes toujours vulnerables de plusieurs manieres. A la place, utiliser la forme 
a trois arguments de open pour ouvrir proprement tout nom fichier arbitraire et sans 
aucun risque (supplementaire) concernant la securite : 

open(HF, "<", $chemin) or die "Impossible d'ouvrir $chemin : $!"; 

D'un autre cote, si ce que vous recherchez est un veritable appel systeme dans le style de 
open(2) en C, avec les cloches et sirenes d'arret qui s'en suivent, alors investissez sur sy- 
sopen : 

use Fcntl; 

sysopen(HF, $chemin, 0_RD0NLY) or die "Impossible d'ouvrir $chemin : $!"; 

Si vous etes sur un systeme qui fait la distinction entre les fichiers textes et binaires, vous 
pouvez avoir besoin de placer votre handle de fichier en mode binaire — ou oubliez de 
faire cela, comme cela peut s'averer — pour eviter de mutiler vos fichiers. Sur de tels sys- 
temes, si vous utilisez le mode texte avec des fichiers binaires, ou Finverse, vous n'appre- 
cierez certainement pas les resultats. 

Les systemes qui ont besoin de la fonction binmode se distinguent des autres par le for- 
mat employe pour les fichiers textes. Ceux qui s'en passent, finissent chaque ligne avec 
un seul caractere correspondant a ce que le C pense etre un saut de ligne, \n. Unix et 
Mac OS tombent dans cette categoric Les systemes d'exploitation des autres varietes 
VMS, MVS, MS-biduletrucmachinchouette et S&M traitent differemment les en- 
trees/sorties dans les fichiers textes et binaires, ils ont done besoin de binmode. 

Ou de son equivalent. Depuis la version 5.6 de Perl, vous pouvez specifier le mode bi- 



Fonctions Perl par ordre alphabetique 



715 



naire dans la fonction open sans un appel separe a binmode. En tant que composantes de 
l'argument MODE (mais uniquement dans la forme a trois arguments), vous pouvez spe- 
cifier diverses disciplines d'entrees/sorties. Pour obtenir l'equivalent d'un binmode, em- 
ployez la forme a trois arguments de open et donnez une discipline valant : raw apres les 
autres caracteres de MODE : 

open(HF, "<:raw", $chemin) or die "Impossible d'ouvrir $chemin : $!"; 

Puisqu'il s'agit d'une toute nouvelle fonctionnalite, il existera certainement plus de dis- 
ciplines au moment oil vous lirez ceci que lorsque nous l'avons ecrit. Cependant, nous 
pouvons raisonnablement predire qu'il y aura en toute vraisemblance des disciplines 
qui ressembleront pour toutes ou partie a celles du tableau 29-2. 



Tableau 29-2. Disciplines d'entrees/sorties 



Discipline 


Signification 


:raw 


Mode binaire ; ne pas traiter. 


:text 


Traitement par defaut de texte. 


:def 


Defaut declare par « use open ». 


:latinl 


Le fichier doit etre en ISO-8859-1. 


:ctype 


Le fichier doit etre en LC TYPE. 


:utf8 


Le fichier doit etre en UTF-8. 


:utfl6 


Le fichier doit etre en UTF-16. 


:utf32 


Le fichier doit etre en UTF-32. 


:uni 


Pressent de l'Unicode (UTF-*). 


:any 


Pressent de PUnicode/Latinl/LC-CTYPE. 


:xml 


Utilise l'encodage specifie dans le fichier. 


:crlf 


Pressent des sauts de lignes. 


: para 


Mode paragraphe. 


: slurp 


Mode par avalement tout rond. 



Vous serez capables d'empiler les disciplines susceptibles d'etre empilees, ainsi, vous 
pourrez ecrire par exemple : 

open(HF, "<:para:crl-f :uni", $chemin) 

or die "Impossible d'ouvrir $chemin : $!"; 
while ($para ) <HF>) { ... } 

Ceci positionnera les disciplines : 

• en lisant certaines formes d'Unicode et en les convertissant vers le format interne 
de Perl UTF-8 si le fichier n'est pas d'ores et deja en UTF-8 ; 

• en cherchant les variantes des sequences de fin de ligne et en les convertissant tou- 
tes vers \n, et ; 

• en traitant le fichier paragraphe par paragraphe, un peu comme le fait $/= " " . 

Si vous voulez positionner le mode d'ouverture par defaut (:def ) a autre chose que 
:text, vous pouvez declarer ceci au tout debut de votre fichier avec le pragma open : 



716 



Chapitre 29 — Fonctions 



use open IN => ":any", OUT => ":utf8"; 

En fait, ce serait vraiment beau si un jour ou l'autre c'etait la discipline : text par defaut. 
Ceci ref lete bien l'esprit du dicton : « Soyez tolerant avec ce que vous acceptez et strict 
avec ce que vous produisez. » 



opendir u @ DD [S 

opendir HANDL EREPERTOIRE , EXPR 

Cette fonction ouvre un repertoire nomme EXPR pour le traiter par readdir, telldir, 
seekdir, rewinddir et closedir. La fonction renvoie vrai en cas de reussite. Les handles 
de repertoires possedent leur propre espace de nommage, separe de celui des handles 
de fichiers. 



ord B 

ord EXPR 
ord 

Cette fonction renvoie la valeur numerique (ASCII, Latin-1 ou Unicode) du premier ca- 
ractere de EXPR. La valeur de retour est toujours non-signee. Si vous desirez une valeur 
signee, utilisez unpack ( ' c ' , EXPR). Si vous voulez convertir tous les caracteres de la chai- 
ne en une liste de nombres, utilisez unpack('U*' , EXPR) a la place. 



our 

our TYPE EXPR : ATTRIBUTS 
our EXPR : ATTRIBUTS 
our TYPE EXPR 
our EXPR 

Un our declare une ou plusieurs variables comme etant des variables globales valides a 
l'interieur du bloc, du fichier ou de l'eval l'encadrant. C'est-a-dire que Ton determine 
la visibilite de our avec les memes regies qu'une declaration my. Mais our ne cree pas de 
variable privee ; il permet simplement l'acces sans entraves a la variable de paquetage 
globale existante. Si plus d'une valeur est listee, la liste doit etre placee entre parenthe- 
ses. 

L'utilisation principale d'un our est de cacher la variable des effets d'une declaration use 
strict "vars" ; puisque la variable est masquee comme une variable my, vous avez la 
permission d'utiliser la variable declaree globale sans la qualifier avec son paquetage. 
Cependant, tout comme une variable my, cela ne marche que dans la portee lexicale de 
la declaration our. En regard de ceci, our differe de use vars, qui affecte le paquetage 
dans son entier et qui n'a pas de portee lexicale. 

our est egalement semblable a my en ce que vous etes autorise a declarer une variable 
avec un TYPE et des ATTRIBUTS. Voici la syntaxe : 

our Chien $medor :oreilles(courtes) :queue(longue); 

Au moment oil nous ecrivons ceci, sa signification n'est pas tout a fait claire. Les attri- 
buts peuvent affecter soit la variable globale, soit l'interpretation locale de $medor. D'un 
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cote, cela ressemblerait fort aux variables my pour les attributs que Ton protege d'un voi- 
le dans la vue locale actuelle de $medor, sans interferer avec les autres vues de la variable 
globale a d'autres endroits. De Fautre cote, si un module declare $medor comme etant 
un Chien et qu'un autre declare $medor en tant que Chat, vous pouvez finir avec des 
chiens miaulant et des chats aboyant. C'est un sujet de recherche active, ce qui est une 
maniere polie de dire que nous ne savons pas de quoi nous parlons a l'heure actuelle. 
(Excepte que nous savons quoi faire avec une declaration de TYPE lorsque la variable se 
refere a un pseudo-hachage — voir Gestion des donnees d'instance au chapitre 12.) 

Une autre similitude entre our et my reside dans sa visibilite. Une declaration our declare 
une variable globale qui sera visible tout au long de sa portee lexicale, meme au-dela des 
frontieres de paquetages. Le paquetage dans lequel la variable est situee est determine a 
Fendroit de la declaration, pas a l'endroit oil on l'utilise. Cela signifie que le comporte- 
ment suivant est valide et qu'il est juge etre une fonctionnalite : 

package True; 

our $machin; # $machin est $Truc: :machin pour le reste de la 

# portee lexicale 

$machin = 582; 
package Machin 

print $machin; # $affiche 582, comme si 'our-' avait ete 'my' 

Toutefois, la distinction entre my qui cree une nouvelle variable privee et our qui expose 
une variable globale existante est importante, particulierement pour les affectations. Si 
vous combinez une affectation a l'execution avec une declaration our, la valeur de la va- 
riable globale ne disparaitra pas une fois que le our sortira de la portee. Pour cela, vous 
avez besoin de local : 

($x, $y) = ("un", "deux"); 

print "avant le bloc, x vaut $x, y vaut $y\n"; 
{ 

our $x = 10; 
local our $y = 20; 

print "dans le bloc, x vaut $x, y vaut $y\n"; 

} 

print "apres le bloc, x vaut $x, y vaut $y\n"; 

Cela affiche : 

avant le bloc, x vaut un, y vaut deux 
dans le bloc, x vaut 10, y vaut 20 
apres le bloc, x vaut 10, y vaut deux 

De multiples declarations our dans la meme portee sont autorisees si elles se trouvent 
dans des paquetages differents. Si elles se produisent dans le meme paquetage, Perl 
emettra des avertissements, si vous lui demandez de le faire. 

use warnings; 
package True; 

our $machin; # declare $Truc: : machin pour le reste de la 

# portee lexicale 

$machin = 20; 
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package Machin; 
our $machin = 30; 



# declare $Machin: : machin pour le reste de la 

# portee lexicale 

# affiche 30 



print $machin; 



our $machin; # emet un avertissement 

Voir aussi local, my et la section Declarations avec portee au chapitre 4. 



pack 



pack CANEVAS, LISTE 

Cette fonction prend une LISTE de valeurs ordinaires Perl, les convertit en une chaine 
d'octets en fonction du CANEVAS et renvoie cette chaine. La liste d'arguments est comple- 
ted ou tronquee selon les besoins. C'est-a-dire que si vous fournissez moins d'arguments 
que n'en requiert le CANEVAS, pack suppose que les arguments additionnels sont nuls. A 
l'inverse, si vous fournissez plus d'arguments que n'en requiert le CANEVAS, les argu- 
ments supplementaires sont ignores. Les formats inconnus du CANEVAS leveront des ex- 
ceptions. 

Le CANEVAS decrit une structure de chaine en tant que sequence de champs. Chaque 
champ est represente par un seul caractere qui decrit le type de la valeur et son encoda- 
ge. Par exemple, un caractere de format valant N specifie un entier non-signe de quatre 
octets dans l'ordre de la notation gros-boutiste (N.d.T. : big-endian). 

Les champs sont empaquetes dans l'ordre donne par le CANEVAS. Par exemple, pour em- 
paquete un entier signe d'un octet et un nombre en virgule flottante avec une simple 
precision dans une chame, vous devez ecrire : 

$chaine = pack("Cf", 244, 3.14); 

Le premier octet de la chaine renvoyee a la valeur 244. Les octets restants representent 
l'encodage de 3.14 en tant que nombre flottant en simple precision. L'encodage parti- 
culier du nombre a virgule flottante depend du materiel de votre ordinateur. 

Les points importants a considerer lorsque vous utilisez pack sont : 

• le type de donnee (comme un entier, un nombre a virgule flottante ou une 



• l'intervalle de valeurs (comme lorsque vos entiers occupent un, deux, quatre ou 
peut-etre meme huit octets ; ou si vous empaquetez des caracteres 8-bits ou 
Unicode) ; 

• si vos entiers sont signes ou non ; 

• l'encodage a employer (comme un empaquetage de bits ou d'octets en natif, en 
petit-boutiste ou en gros-boutiste. 

Le tableau 29-3 liste les caracteres de format et leurs significations. (D'autres caracteres 
peuvent apparaitre dans les formats ; ils seront decrits plus tard.) 

Vous pouvez librement placer des espaces et des commentaires dans vos CANEVAS. Les 
commentaires commencent par le symbole # habituel et se prolongent jusqu'a la pre- 
miere fin de ligne (s'il y en a) dans le CANEVAS. Chaque lettre peut etre suivie par un 
nombre indiquant le compteur, que Ton interprete comme le compteur de repetitions 
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Tableau 29-3. Caracteres de canevas pour pack/unpack 



Caractere 


Signification 


a 


Une chaine d'octets, completee par des nuls. 


A 


Une chaine d'octets, completee par des blancs. 


D 


Une chaine de bits, dans l'ordre croissant des bits a l'interieur de chaque 




octet (comme vec). 


B 


tine chaine de bits dans l'ordre decroissant des bits a l'interieur de cba- 




que octet. 


c 


Une valeur caractere signee (entier 8-bits). 


C 


Une valeur caractere non-signee (entier 8-bits) ; voir U pour Unicode. 


d 


Un nombre a virgule f lottante en double precision au format natif. 


f 


Un nombre a virgule f lottante en simple precision au format natif. 


h 


Une chaine hexadecimale, quartet de poids faible d'abord. 


H 


Une chaine hexadecimale, quartet de poids fort d'abord. 


i 


Une valeur entiere signee au format natif. 


I 


Une valeur entiere non-signee au format natif. 


1 


Une valeur entiere longue signee, toujours de 32 bits. 


L 


Une valeur entiere longue non-signee, toujours de 32 bits. 


n 


Un court de 16 bits, dans l'ordre « reseau » (gros-boutiste). 


N 


Un long de 32 bits, dans l'ordre « reseau » (gros-boutiste). 


P 


Un pointeur sur une chaine terminee par un caractere nul. 


P 


Un pointeur sur une chaine de longueur fixe. 


q 


Une valeur quad (entier de 64 bits) signee. 


0 


Une valeur quad (entier de 64 bits) non-signee. 


s 


Une valeur entiere courte signee, toujours de 16 bits. 


S 


Une valeur entiere courte non-signee, toujours de 16 bits. 


u 


Une chaine uuencodee. 


U 


Un nombre en caractere Unicode. 


V 


Un court de 16 bits dans l'ordre « VAX » (petit-boutiste). 


V 


Un long de 32 bits dans l'ordre « VAX » (petit-boutiste). 


w 


Un entier compresse au format BER. 


X 


Un octet nul (avance d'un octet). 


X 


Recule d'un octet. 


Z 


Une chaine d'octets terminee par un caractere nul (et completee par des 




nuls). 


9 


Remplissage avec un caractere nul a la position absolue. 



ou la longueur en quelque sorte, selon le format. Avec tous les formats exceptes a, A, b, 
B, h, H, P et Z, compteur est un compteur de repetition, pack engloutit autant de valeurs 
dans la LISTE. Un * pour le compteur signifie autant d'entites qu'il en reste. 
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Les formats a, A et Z n'engloutissent qu'une seule valeur, mais l'empaquetent comme 
une chaine d'octets de longueur compteur, en la completant avec des caracteres nuls ou 
des espaces si besoin. Lorsqu'on depaquete, A depouille les espaces et les caracteres nuls 
qui traine, Z depouille tout ce qui se trouve apres le premier caractere nul et a renvoie 
la donnee litterale indemne. Lorsqu'on empaquete, a et Z sont equivalents. 

De meme, les formats b et B empaquetent une chaine longue de compteur bits. Chaque 
octet du champ d'entree genere 1 bit dans le resultat base sur le bit le moins significatif 
de chaque octet d'entree (c'est-a-dire, sur ord($octet) % 2). Commodement, cela signi- 
fie que les octets 0 et 1 generent les bits 0 et 1. En partant du debut de la chaine d'entree, 
chaque 8-tuple d'octets est convertit vers un unique octet en sortie. Si la longueur de la 
chaine d'entree n'est pas divisible par 8, le reste est empaquete comme s'il etait complete 
par des Os. De meme, durant le depaquetage avec unpack les bits supplementaires sont 
ignores. Si la chaine d'entree est plus longue que necessaire, les octets supplementaires 
sont ignores. Un * comme compteur signifie l'utilisation de tous les octets du champ 
d'entree. Durant le depaquetage avec unpack, les bits sont convertis vers une chaine de 
Os et de Is. 

Les formats h et H empaquetent une chaine de compteur quartets (groupes de 4 bits sou- 
vent represented comme des chiffres hexadecimaux). 

Le format p empaquete un pointeur sur une chaine terminee par un caractere null. II 
vous incombe de vous assurer que la chaine n'est pas une valeur temporaire (qui est sus- 
ceptible d'etre desallouee avant que vous n'ayez fini d'utiliser le resultat empaquete) Le 
format P empaquete un pointeur vers une structure dont la taille est indiquee par comp- 
teur. Un pointeur nul est cree si la valeur correspondante pour p ou P est undef. 

Le caractere / permet d'empaqueter et de depaqueter des chaines dans lesquelles la 
structure empaquetee contient un compteur sur un octet suivi par la chaine elle-meme. 
On ecrit entite-longueur/entite-chaine. Ventite-longueur peut etre n'importe 
quelle lettre canevas de pack et decrit comment la valeur representant la longueur est 
empaquetee. Les canevas les plus susceptibles d'etre utilises sont ceux empaquetant des 
entiers comme n (pour les chaines Java), w (pour de l'ASN.l ou du SNMP) et N (pour du 
XDR de Sun). Uentite-chaine doit, a present, etre A*, a* ou Z*. Pour unpack, la lon- 
gueur de la chaine est obtenue a partir de Yentite-longueur, mais si vous avez mis un 
*, elle sera ignoree. 

unpack 'C/a' , "\04Gurusamy"; # donne 'Guru' 

unpack 'a3/A* A*', '007 Bond J # donne ('Bond'/D') 

pack 'n/a* vi/a*' , 'bonjour, ' , 'le monde'; # donne "bonjour, le monde" 

unpack ne renvoie pas explicitement Yentite-longueur. L'ajout d'un compteur a la let- 
tre de Yentite-longueur n'est pas susceptible d'etre utile a quoique ce soit, sauf si cette 
lettre est A, a ou Z. L'empaquetage avec une entite-longueur de a ou Z introduit des ca- 
racteres nuls (\0), que Perl ne considere pas comme legaux dans les chaines numeriques. 

Les formats d'entiers s, S, 1 et L peuvent etre immediatement suivis par un ! pour signi- 
fier des entiers courts ou longs natifs a la place de mesurer exactement 16 et 32 bits, res- 
pectivement. A ce jour, c'est un probleme principalement pour les plates-formes 64 bits, 
oil les entiers cours et longs natifs tel que les voient le compilateur local C peuvent etre 
completement differents de ces valeurs. (i ! et I ! fonctionnent mais seulement a cause 
de la completude ; ils sont identiques a i et I.) 
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La taille reelle (en octets) des entiers, des courts, des longs et des « longs longs » natifs 
sur la plate-forme ou Perl a ete compile est egalement disponible via le module Conf ig : 

use Config; 

print $Conf ig{shortsize}, "\n"; 

print $Config{intsize}, "\n"; 

print $Config{longsize}, "\n"; 

print $Conf ig{longlongsize}, "\n"; 

Le simple fait que Configure connaisse la taille d'un « long long », n'implique pas force- 
ment que vous disposiez des formats q et 0. (Certains systemes en disposent, mais vous 
n'en possedez certainement pas. Du moins pas encore.) 

Les formats d'entiers d'une longueur plus grande qu'un seul bit (s, S, i, I, 1 et L) sont 
intrinsequement non portables entre processeurs differents, car ils obeissent a Fordre 
des octets natifs et au paradigme petit-boutiste/gros-boutiste. Si vous voulez des entiers 
portables, utilisez les formats n, N, v et V ; Fordre de leurs bits et leur taille sont connus. 

Les nombres a virgules f lottantes ne se trouvent que dans le format natif de la machine. 
A cause de la variete des formats des flottants et de l'absence d'une representation 
« reseau » standard, il n'existe pas d'inter-echanges facilites. Cela signifie que si Ton ecrit 
des donnees a virgule flottante empaquetees sur une machine, elles pourront ne pas 
etre lisibles sur une autre. Ceci est un probleme meme lorsque les deux machines utilise 
Farithmetique flottante IEEE, car Fordre (petit-boutiste/gros-boutiste) de la representa- 
tion en memoire ne fait pas partie de la specification IEEE. 

Perl utilise en interne des doubles pour tous les calculs en virgule flottante, done la con- 
version depuis un double vers un float, puis la conversion inverse perdra de la precision. 
Cela signifie que unpack("f", pack("f", $truc)) ne sera generalement pas egal a 
$truc. 

Vous etes responsable de toute consideration concernant les alignements ou les remplis- 
sages exiges par d'autres programmes, particulierement par ces programmes crees par 
un compilateur C avec sa propre idiosyncrasie en matiere de presentation d'une struct 
C sur Farchitecture particuliere en question. Vous devrez ajouter suffisamment de x du- 
rant l'empaquetage pour compenser ceci. Par exemple, une declaration C de : 

struct machin { 

unsigned char c; 
float f; 

} 

pourrait etre ecrite dans un format « C x f », ou « C x3 f », ou encore « f C » — pour 
n'en citer que quelques uns. Les fonctions pack et unpack gerent leurs entrees et leurs 
sorties comme des sequences plates d'octets car il n'y a aucun moyen pour elles de savoir 
oil vont les octets, n d'oii ils viennent. 

Regardons quelques exemples. Cette premiere paire empaquete des valeurs numeriques 
dans des octets : 

$sortie = pack "CCCC", 65, 66, 67, 68; # $sortie eq "ABCD" 
$sortie = pack "C4", 65, 66, 67, 68; # idem 

Celui-ci fait la meme chose avec des lettres Unicode : 

$machin = pack("U4",0x24b6,0x24b7,0x24b8,0x24b9); 
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Celui-la est similaire, avec une paire de caracteres nuls rentrant en jeu : 

$sortie = pack "CCxxCC", 65, 66, 67, 68 # $sortie eq "AB\0\OCD" 

Empaqueter vos entiers courts n'implique pas que vous soyez portable : 

$sortie = pack "s2", 1, 2; # "\1\0\2\0" en petit-boutiste 

# "\0\1\0\2" en gros-boutiste 

Dans les paquets binaires et hexadecimaux, le compteur se refere au nombre de bits ou 
de quartets, pas au nombre d'octets produits : 

$sortie = pack "B32", "01010000011001010111001001101100"; 
$sortie = pack "H8", "5065726c"; # les deux donnent "Perl" 

La longueur dans un champ a ne s'applique qu'a une seule chaine : 

$sortie = pack "a4", "abed", "x", "y", "z"; # "abed" 

Pour contourner cette limitation, utilisez plusieurs specificateurs : 

$sortie = pack "aaaa", "abed", "x", "y", "z"; # "axyz" 
$sortie = pack "a" x 4, "abed", "x", "y", "z"; # "axyz" 

Le format a remplit avec des caracteres nuls : 

$sortie = pack "al4", "abedefg"; # "abcdefg\0\0\0\0\0\0\0" 

Ce canevas empaquete un enregistrement de struct tm C (du moins sur certains syste- 
mes) : 

$sortie = pack "i9pl", gmtimeQ, $tz, $toff; 

Generalement, le meme canevas peut egalement etre utilise dans la fonction unpack, 
bien que certains formats se comportent differemment, notamment a, A et Z. 

Si vous voulez joindre des champs de texte de taille fixe, utilisez pack avec un CANEVAS 
de format A ou a : 

$chaine = pack("A10" x 10, @data); 

Si vous voulez joindre des champs de texte de taille variable avec un separateur, utilisez 
plutot la fonction join: 

$chaine = join(" and ", @donnee); 

$chaine = join("", @donnee); # separateur nul 

Bien que tous nos exemples utilisent des chaines litterales comme canevas, il n'y a rien 
qui vous interdise d'aller chercher vos donnees dans un fichier sur disque. Vous pouvez 
construire une base de donnees relationnelle complete autour de cette fonction. (Nous 
ne nous etendrons pas sur ce que cela prouverait sur votre nature.) 

package 

package ESPACEDENOM 
package 

Il ne s'agit pas vraiment d'une fonction, mais d'une declaration qui affirme que le reste 
de la portee la plus interieure l'encadrant appartient a la table de symboles ou l'espace 
de nom, indique. (La portee d'une declaration package est ainsi la meme que la portee 
d'une declaration my ou our.) A l'interieur de cette portee, la declaration force le com- 
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pilateur a resoudre tous les identificateurs non qualifies en les recherchant dans la table 
de symboles du paquetage declare. 

Une declaration package n'afFecte que les variables globales — y compris celles sur les- 
quelles vous avez employe local — et pas les variables lexicales declarees avec my. Elle 
affecte seulement les variables globales non qualifiees ; celles qui sont qualifiees avec 
leur propre nom de paquetage ignorent le paquetage actuellement declare. Les varia- 
bles globales declarees avec our ne sont pas qualifiees et respectent par consequent le 
paquetage courant, mais seulement a l'endroit de leur declaration, apres quoi dies se 
comportent comme des variables my. C'est-a-dire que pour le reste de leur portee lexica- 
le, les variables our sont « clouees » au paquetage courant au moment de leur declara- 
tion, meme si une declaration de paquetage ulterieure intervient. 

La declaration package est generalement la premiere d'un fichier a inclure avec un ope- 
rateur require ou use, bien qu'elle puisse se trouver en tout endroit legal pour une ins- 
truction. Lorsqu'on cree un fichier de module traditionnel ou oriente objet, il est 
courant d'appeler le paquetage avec le meme nom que le fichier pour eviter toute con- 
fusion. (II est egalement courant de mettre la premiere lettre du nom du paquetage en 
majuscule car les modules en minuscules sont interpreted par convention comme dant 
des pragmas.) 

Vous pouvez passer dans un paquetage donne par plus plus d'un endroit ; cela influence 
le choix de la table des symboles utilisee par le compilateur pour le reste de ce bloc. (Si 
le compilateur rencontre un autre paquetage declare au meme niveau, la nouvelle de- 
claration ecrase Fancienne.) Votre programme principal est cense commencer par une 
declaration package main. 

Vous pouvez vous referer a des variables, des sous-programmes, des handles de fichier 
et des formats appartenant a d'autres paquetages en prefixant l'identificateur avec le 
nom du paquetage et un double deux-points : $Paquetage: : Variable. Si le nom du pa- 
quetage est nul, le paquetage principal est pris par defaut. C'est-a-dire que $ : : heureuse 
est equivalents a $main: : heureuse, tout comme a $main' heureuse, que Ton rencontre 
encore parfois dans d'anciens codes. 

Voici un exemple : 

package main; $heureuse = "un poker de dames"; 
package Donne; $heureuse = "truquee"; 
package Nimporte; 

print "Ma main heureuse est $main: :heureuse.\n"; 
print "La donne heureuse est $Donne: :heureuse.\n"; 

Ce qui affiche : 

Ma main heureuse est un poker de dames. 
Ma donne heureuse est truquee. 

La table de symboles d'un paquetage est stockee dans un hachage avec un nom se ter- 
minant par un double deux-points. La table de symboles du paquetage principal est par 
exemple appelee %main : : . On peut done aussi acceder au symbole *main : : heureuse par 
$main: :{"heureuse"}. 

Si ESPACE_DE_NOM est omis, il n'y aura alors aucun paquetage courant et tous les identi- 
fiants devront etre pleinement qualifies ou declares comme lexicaux. C'est encore plus 
strict qu'un use strict, puisque cela s'etend egalement aux noms de fonctions. 
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Voir le chapitre 10, Paquetages, pour plus d'informations sur les paquetages. Voir my plus 
haut dans ce chapitre pour d'autres considerations sur les portees. 

pipe m a m 

pipe HANDLE_LECTURE, HANDLE _ECRITURE 

Comme l'appel systeme correspondant, cette fonction ouvre deux pipes connected, voir 
pipe(2). Cet appel est presque toujours employe avant un fork, apres lequel le lecteur 
du pipe doit fermer HANDLE_ECRITURE et celui qui ecrit doit fermer HANDLE_LECTURE. (Si- 
non le pipe n'indiquera pas la fin de fichier a celui qui lit quand celui qui ecrit le ferme- 
ra.) Si vous lancez une boucle de processus par des pipes, un verrou mortel peut se 
produire a moins d'etre tres prudent. Notez de plus que les pipes de Perl utilisent des 
tampons d'entrees/sorties standard et qu'il vous faut done positionner $| 
($0UTPUT_AUT0FLUSH) sur votre HANDLE_ECRITURE pour vider les tampons apres chaque 
operation de sortie, selon l'application - voir select (handle de fichier de sortie). 

(Comme avec open, si l'un des handle de fichier est indefini, il sera autovivifie.) 

Voici un petit exemple : 

pipe(LISEZ_M0I, ECRIVEZ_M0I); 
unless ($pid = fork) { # fils 

defined $pid or die "Impossible de forker : $!"; 

close(LISEZ_M0I); 

for $i (1..5) { print ECRIVEZ_M0I "ligne $i\n" } 
exit; 

} 

$SIG{CHLD} = sub { waitpid($pid, 0) }; 

close(ECRIVEZ_MOI); 

@chaines = <LISEZ_M0I>; 

close (LISEZJ10I); 

print "Recu: \n", @chaines; 

Remarquez comment l'ecrivain ferme l'extremite de lecture et comment a l'inverse le 
lecteur ferme l'extremite d'ecriture. Vous ne pouvez pas utiliser un seul pipe pour une 
communication a double sens. Utilisez pour cela soit deux pipes differents, soit l'appel 
systeme socketpair. Voir la section Pipes au chapitre 16. 

pop 

pop TABLEAU 
pop 

Cette fonction traite un tableau comme une pile — elle depile (enleve) et renvoie la der- 
niere valeur du tableau en le raccourcissant d'un element. Si TABLEAU est omis, la fonc- 
tion depile @_ dans la portee lexicale des sous-programmes et formats ; elle depile @ARGV 
dans la portee des fichiers (generalement le programme principal) ou a l'interieur de la 
portee lexicale etablie par les constructions eval CHAINE, BEGIN {}, CHECK {}, INIT {} 
et END {}. Elle entrame les memes effets que : 

$tmp = $TAB L E AU{ $#TAB LE AU - - } ; 



Fonctions Perl par ordre alphabetique 



725 



ou que : 

$tmp = splice (^TABLEAU, -1; 

S'il n'y a pas d'element dans le tableau, pop renvoie undef. (Mais ne vous basez pas sur 
ceci pour vous dir que le tableau est vide si votre tableau continent des valeurs undef !) 
Voir egalement push et shift. Pour depiler plus d'un element, utilisez splice. 

Le premier argument de pop doit etre un tableau et non une liste. Pour obtenir le der- 
nier element d'une liste, utilisez ceci : 

( LISTE )[-l] 

pos E 

pos SCALAIRE 
pos 

Cette fonction renvoie l'endroit de SCALAIRE ou la derniere recherche m//g s'est arretee. 
Elle renvoie le decalage du caractere suivant celui qui correspondait. (C'est-a-dire que 
c'est equivalent a length($') + length($&).) II s'agit du decalage ou la prochaine re- 
cherche m//g sur cette chaine demarrera. Rappelez-vous que le decalage debut de la 
chaine est 0. Par exemple : 

$grafitto = "fee fie foe foo"; 
while ($grafitto =~ m/e/g) { 
print pos $grafitto, "\n"; 

} 

affiche 2, 3, 7 et 11, les decalages de chacun des caracteres suivant un « e » . On peut as- 
signer a pos une valeur pour indiquer a m//g d'ou partir : 

$grafitto = "fee fie foe foo"; 

pos $grafitto = 4; # Sauter le fee, commencer a fie 
while ($grafitto =~ m/e/g) { 
print pos $grafitto, "\n"; 

} 

Cela n'affiche que 7 et 11. L'assertion \G ne recherche de correspondance qu'a l'endroit 
specifie par pos a ce moment dans la chaine dans laquelle on recherche. Voir la section 
Positions au chapitre 5. 

print Bi@ 

print HANDLE FICHIER LISTE 

print LISTE 

print 

Cette fonction affiche une chaine ou une liste de chames separees par des virgules. Si la 
variable $\ ($OUTPUT_RECORD_SEPARATOR) est positionnee, son contenu sera affiche im- 
plicitement a la fin de la liste. La fonction renvoie vrai en cas de reussite, sinon faux. 
HANDLE_FICHIER peut etre un nom de variable scalaire (non indicee), auquel cas la va- 
riable contient la nom du veritable handle de fichier ou une reference a un objet handle 
de fichier d'une quelconque sorte. HANDLE_FICHIER peut egalement etre un bloc qui 
renvoie une telle valeur : 
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print { $0K ? "STDOUT" : "STDERR" } "$truc\n"; 
print { $handle_entrees_sorties[$i] } "$truc\n"; 

Si HANDLE_FICHIER est une variable et que le token suivant est un terme, elle peut etre 
prise a tort pour un operateur a moins que vous n'interposiez un + ou ne mettiez des 
parentheses autour des arguments. Par exemple : 

print $a - 2; # envoie $a - 2 sur le handle par defaut (en general STDOUT) 
print $a (- 2); # envoie -2 sur le handle de fichier specif ie par $a 
print $a -2; # idem (regies d'analyse bizarres :-) 

Si HANDLE_FICHIER est omis, la fonction affiche sur le handle de fichier de sortie actuel- 
lement selectionne, initialement STDOUT. Pour mettre le handle de fichier de sortie par 
defaut a autre chose que STDOUT, utilisez l'operation select HANDLE_FICHIER. 9 Si LISTE 
est egalement omise, la fonction affiche $_. Comme print prend une LISTE en argu- 
ment, tout element de cette LISTE est evalue dans un contexte de liste. Ainsi quand vous 
ecrivez : 

print SORTIE <STDIN>; 

ce n'est pas la ligne suivante de l'entree standard qui va etre affichee, mais toutes les li- 
gnes de l'entree standard jusqu'a la fin du fichier, puisque c'est ce que <STDIN> renvoie 
dans un contexte de liste. Si vous voulez autre chose, ecrivez : 

print SORTIE scalar <STDIN>; 

De meme, en se souvenant de la regie si-ca-ressemble-a-une-fonction-c'est-une-fonction, 
faites attention a ne pas faire suivre le mot-cle print d'une parenthese gauche a moins 
que la parenthese droite correspondante ne termine les arguments du print- interposez 
un + ou mettez des parentheses a tous les arguments : 

print (l+2)*3, "\n"; # mauvais 
print +(l+2)*3, "\n"; # ok 
print ((l+2)*3, "\n"); # ok 



printf HANDLE FICHIER FORMAT, LISTE 
printf FORMAT, LISTE 

Cette fonction affiche une chaine formatee sur HANDLE_FICHIER ou, s'il est omis, sur le 
handle de fichier de sortie courant, initialement STDOUT. Le premier element de LISTE 
doit etre une chaine qui indique comme formater les elements suivants. La fonction est 
similaire a printf (3) et fprintf (3). La fonction est exactement equivalente a : 

print HANDL E_ FICHIER sprintf FORMAT, LISTE 

sauf que $\ ($OUTPUT_RECORD_SEPARATOR) n'est pas ajoute a la fin. Si use locale est actif, 
le caractere utilise comme separateur de la partie decimale dans les nombres a virgule 
flottante est affecte par la locale LC_NUMERIC. 

Une exception n'est levee que si un type de reference invalide est employe pour l'argu- 



9. STDOUT n'est done pas vraiment le handle de fichier par defaut pour print. II est en fait le 
handle de fichier par defaut du defaut. 
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ment HANDLE_FICHIER. Les formats inconnus sont sautes sans modification. Ces deux si- 
tuations declenchent des avertissements si ceux-ci sont actives. 

Voir les fonctions print et sprintf ailleurs dans ce chapitre. La description de sprintf 
inclut la liste des specifications des formats. Nous l'aurions volontiers reproduite ici, 
mais ce livre est d'ores et deja un desastre ecologique. 

Si vous omettez a la fois le FORMAT et la LISTE, $_ est utilise — mais dans ce cas, vous 
auriez du utiliser print. Ne tombez pas dans le piege d'utiliser un printf lorsqu'un sim- 
ple print aurait tres bien fait l'affaire. La fonction print est bien plus efficace et bien 
moins sujette a erreurs. 

prototype @ 

prototype FONCTION 

Renvoie le prototype d'une fonction dans une chame (ou undef si la fonction n'a pas de 
prototype). FONCTION est une reference vers, ou le nom de, la fonction pour laquelle 
vous desirez trouver le prototype. 

Si FONCTION est une chame commencant par CORE : :, la suite est prise en tant que nom 
pour les fonctions internes de Perl, et une exception est levee s'il n'existe pas de telle 
fonction interne. Si la fonction interne n'est pas surchargeable (comme qw/7) ou si ses 
arguments ne peuvent pas etre exprimes par un prototype (comme system), la fonction 
renvoie undef car la fonction interne ne se comporte pas veritablement comme une 
fonction Perl. Sinon, la chame decrivant le prototype equivalent est renvoyee. 



push 

push TABLEAU 
push 

Cette fonction traite TABLEAU comme une pile et empile les valeurs de LISTE a la fin du 
tableau. La taille de TABLEAU est allongee de la longueur de LISTE. La fonction renvoie 
cette nouvelle taille. La fonction push entraine les memes effets que : 

foreach $valeur (fonction_liste()) { 
$tableau[++$#tableau] = $valeur; 

} 

ou que : 

splice ^tableau, (^tableau, 0, fonction_liste(); 

mais est beaucoup plus performante (a la fois pour vous et pour votre ordinateur). Vous 
pouvez utilisez push associee avec shift pour construire une file ou un registre a deca- 
lage assez efficace : 

for (;;) { 

push (Stableau, shift ^tableau; 

} 

Voir egalement pop et unshift. 
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q/CHAINE/ 

q/CHAINE/ 
qq/ CHAINE/ 
qx/CHAINE/ 
qu/CHAINE/ 
qx/CHAINE/ 

Protections generalisees. Voir la section Choisissez vos delimiteurs au chapitre 2. Pour les 
annotations de statut pour qx//, voir readpipe. Pour les annotations de statut pour 
qr//, voir m//. Voir egalement Carder k contrdle au chapitre 5. 

quotemeta E 

quotemeta EXPR 
quotemeta 

Cette fonction renvoie la valeur de EXPR avec tous les caracteres non alphanumeriques 
precedes d'un backslash (\). (C'est-a-dire que tous les caracteres ne correspondant pas a 
/[A-Za-z_0-9]/ seront precedes d'un backslash dans la chaine renvoyee, sans tenir 
compte des valeurs des locales.) II s'agit de la fonction interne implementant l'echappe- 
ment \0 dans les contextes d'interpolation (comprenant les chaines entre guillemets, 
entre apostrophes inverses ou les motifs). 

rand 

rand EXPR 
rand 

Cette fonction renvoie un nombre a virgule flottante pseudo-aleatoire superieur ou 
egal a 0 et inferieur a la valeur de EXPR. (EXPR doit etre positif.) Si EXPR est omise, la fonc- 
tion renvoie un nombre a virgule flottante entre 0 et 1 (comprenant 0, mais excluant 
1). rand appelle automatiquement srand sauf si la fonction srand a deja ete appelee. 
Voir egalement srand. 

Pour obtenir une valeur entiere, comme pour un lancer de de, combinez ceci avec int, 
comme dans : 

$lancer = int(rand 6) +1; # $lancer est maintenant un entier 

# compris entre 1 et 6 

Comme Perl utilise la fonction pseudo-aleatoire de votre propre bibliotheque C, com- 
me random(3) ou drand48(3), la qualite de la distribution n'est pas garantie. Si vous avez 
besoin d'aleatoire plus fort, comme pour de la cryptographie, vous devriez plutot con- 
suiter la documentation de random(4) (si votre systeme possede un peripherique 
/dev/random ou /dev/urandom), le module Math : : TrulyRandom de CPAN, ou un bon bou- 
quin sur la generation de nombres pseudo-aleatoires en informatique, comme le second 
volume de Knuth. 10 



10. Knuth, D.E. The Art of Computer Programming, Seminumerial Algorithms, vol. 2, 3rd ed. (Rea- 
ding, Mss.: Addison-Wesley, 1997). ISBN 0-201-89684-2. 
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read 



read HANDL E_ FICHIE R, SCALAIRE, LONGUEUR, DECALACE 
read HANDL E_ FICHIER, SCALAIRE, LONGUEUR 

Cette fonction essaye de lire LONGUEUR octets de donnees dans la variable SCALAIRE de- 
puis le HANDLE_FICHIER specifie. La fonction renvoie le nombre d'octets reellement lus 
ou 0 en fin de fichier. undef est renvoyee en cas d'erreur. SCALAIRE est ajuste a la taille 
reellement lue. Le DECALAGE, s'il est specifie, indique l'endroit de la variable a partie du- 
quel commencer a ecrire des octets, vous pouvez ainsi lire au milieu d'une chaine. 

Pour copier des donnees du handle de fichier DEPUIS dans le handle VERS, vous pouvez 
ecrire : 

while (read DEPUIS, $tampon, 16384) { 
print VERS $tampon; 



L'inverse d'un read est simplement print, qui connait deja la longueur de la chaine a 
ecrire, et qui peut ecrire une chaine de n'importe quelle longueur. Ne faites pas l'erreur 
d'employer write, qui est uniquement utilise dans les formats. 

La fonction read de Perl est en fait implementee par la fonction d'entree/sortie standard 
fread(3), ce qui fait que le veritable appel systeme read(2) peut lire plus que LONGUEUR 
octets pour remplir le tampon d'entree et que freadCi) peut faire plus d'un appel syste- 
me a read(2) pour remplir ce tampon. Vous pouvez specifier l'appel systeme reel par 
sysread pour mieux controler les entrees/sorties. Les appels a read et a sysread ne doi- 
vent pas etre melanges a moins d'etre adepte des sciences occultes (ou des soirees cuir 
et chaines). Quelle que soit celle que vous employez, faites attention : lorsque vous lisez 
depuis un fichier contenant un encodage Unicode ou n'importe quel encodage sur plu- 
sieurs octets, les limites du tampon peuvent tomber au milieu d'un caractere. 



readdir HANDLEREPERTOIRE 

Cette fonction lit les entrees de repertoire (qui ne sont que de simples noms de fichiers) 
depuis un handle de repertoire ouvert par opendir. Dans un contexte scalaire, cette 
fonction renvoie l'entree de repertoire suivante si elle existe, undef sinon. Dans un con- 
texte de liste, elle renvoie le reste des entrees du repertoire, ce qui donnera bien sur une 
liste nulle s'il n'y en a plus. Par exemple : 

opendir(CE_REP, "." or die "serieusement endommage : $!"; 

@tous_les_f ichiers = readdir CEREP; 

closedir CEREP; 

print "@tous_les_f ichiers\n"; 

Ceci affiche tous les fichiers du repertoire courant sur une seule ligne. Pour eviter les 
entrees . et . . , employez l'une de ces incantations (quelle que soit celle a laquelle vous 
pensez, elle sera moins illisible) : 

@tous_les_f ichiers = grep { $_ ne ' . ' and $_ ne ' . . ' } readdir CEREP; 

@tous_les_f ichiers = grep { not / A [.][.]?\z/ } readdir CE_REP; 

@tous_les_f ichiers = grep { not / A \.{l,2}\z/ } readdir CEREP; 

|5>tous_les_f ichiers = grep !/ A \.\.?\z/, readdir CE_REP; 



} 



readdir 
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Et pour eviter tous les fichiers . *, ecrivez ceci : 

@tous_les_f ichiers = grep !/ A \./, readdir CE_REP; 
Pour ne lister que les fichiers texte, ecrivez : 

@fichiers_texte = grep -T, readdir CEREP; 

Mais attention a ce dernier exemple, car le repertoire doit etre recolle au resultat de 
readdir si ce n'est pas le repertoire courant — comme ceci : 

opendir(CE_REP, $chemin); or die "opendir $chemin impossible : $!" ; 
@fichiers_points = grep { / A \./ && -f } map { "$chemin/$_" } 
readdir (CE_REP); 
closedir CE_REP; 

readline ss@ 

readline HANDL E_ FICHIER 

II s'agit de la fonction interne implementant l'operateur <HANDLE_FICHIER>, mais vous 
pouvez l'utiliser directement. La fonction lit l'enregistrement suivant depuis 
HANDLE_FICHIER, qui peut etre un nom de handle de fichier ou une expression de han- 
dle de fichier indirect renvoyant soit le nom d'un veritable handle de fichier, soit une 
reference a quoique ce soit ressemblant a une objet handle de fichier, comme un type- 
glob. (Les versions de Perl anterieures a la 5.6 acceptent seulement un typeglob.) Dans 
un contexte scalaire, chaque appel lit et renvoie le prochain enregistrement jusqu'a ce 
que Ton atteigne la fin de fichier, avec laquelle Fappel suivant renvoie undef. Dans un 
contexte de liste, readline lit tous les enregistrements jusqu'a atteindre la fin de fichier 
et renvoie alors une liste d'enregistrements. Par « enregistrements », il faut normale- 
ment entendre une ligne de texte, mais si la variable speciale $/ 
($INPUT_RECORD_SEPARATOR) est differente de sa valeur par defaut, l'operateur 
« avalera » le texte differemment. De mime, certaines disciplines en entree, comme 
: para (mode paragraphe) renverront des enregistrements par morceaux, autres que des 
lignes. Le positionnement de la discipline : slurp (ou $/ = undef) entraihera l'avale- 
ment du fichier entier. 

Lorsqu'on avale des fichiers tout rond dans un contexte scalaire, s'il vous arrive de gober 
un fichier vide, readline renvoie "" la premiere fois et undef toutes les fois suivantes. 
Si l'on avale tout rond en partant du handle de fichier magique ARCy chaque fichier ren- 
voie une seule bouchee (encore une fois, les fichiers vides renvoient ""), suivi par un 
seul undef lorsque tous les fichiers on ete digeres. 

De plus amples details sur l'operateur <HANDLE_FICHIER> sont donnes dans la section 
Operateurs d'entree au chapitre 2. 

$ligne = <STDIN>; 

$ligne = readline(STDIN); # idem 

$ligne = readline(*STDIN); # idem 

$ligne = readline(\*STDIN); # idem 

open my $hf, "<&=STDIN" or die; 

bless $hf => 'UneVieilleClasse'; 

$ligne = readline($hf ); # idem 
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readlink 



BS00 



readlink EXPR 
readlink 

Cette fonction renvoie le nom d'un fichier pointe par un lien symbolique. EXPR doit 
donner le nom d'un fichier dont la derniere composante est un lien symbolique. S'il ne 
s'agit pas d'un lien symbolique, ou si les liens symboliques ne sont pas implementes 
dans le systeme de fichier, ou encore si une erreur se produit, la fonction renvoie la un- 
def et vous devrez verifier le code d'erreur dans $ ! . 

Prenez garde car le lien symbolique renvoye peut etre relatif a l'endroit specifie. Par 
exemple, vous pouvez ecrire : 

readlink "/usr/local/src/exprimez/vous.h" 

et readlink pourrait renvoyer : 

. . /exprimez . 1 . 23/includes/vous . h 

ce qui n'est pas franchement utile a moins que le repertoire courant ne soit justement 
/usr/local/src/exprimez. 



readpipe scalar EXPR 
readpipe LIST (a I'etude) 

II s'agit de la fonction interne implementant la construction protegee qx/7 (connue ega- 
lement en tant qu'operateur apostrophes inverses). Elle est parfois commode lorsque 
vous avez besoin de specifier votre EXPR d'une maniere qui ne serait pas pratique avec 
les apostrophes. Prenez garde car nous pourrions modifier a l'avenir cette interface 
pour supporter un argument LISTE qui la ferait plus ressembler a la fonction exec, 
n'imaginez done pas qu'elle continuera a fournir un contexte scalaire pour EXPR. Indi- 
quez vous-meme scalar ou utilisez la forme avec LISTE. Qui sait, peut-etre cela fonc- 
tionnera-t-il au moment ou vous lirez ceci. 



recv SOCKET, SCALAIRE, LONGUEUR, FLAGS 

Cette fonction recoit un message sur une socket. Elle s'attend a recevoir LONGUEUR octets 
de donnees dans la variable SCALAIRE depuis le handle de fichier SOCKET. La fonction 
renvoie l'adresse de l'expediteur, ou undef s'il y a une erreur. SCALAIRE est ajuste a la lon- 
gueur effectivement lue. Les FLAGS de la fonction sont les memes que ceux de recv(2). 
Voir la section Sockets au chapitre 16. 



readpipe 



recv 



redo 



redo ETIQUETTE 



redo 



L'operateur redo recommence le bloc d'une boucle sans reevaluer la condition. Le bloc 
continue, s'il existe, n'est pas execute. Si YETIOUETTE est omise, l'operateur se refere a la 
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boucle la plus interne l'encadrant. Cet operateur est normalement utilise par les pro- 
grammes qui souhaitent dissimuler a eux-meme ce qui vient d'etre entre : 

# Une boucle qui joint les lignes coupees par un antislash. 
while (<STDIN>) { 

if (s/\\\n$// && defined ($ligne_suivante = <STDIN>)) { 

$_ .= $ligne_suivante; 

redo LIGNE; 

} 

print; # ou ce que vous voulez 

} 

On ne peut pas utiliser redo pour sortir d'un bloc qui renvoie une valeur comme eval 
{}, sub {} ou do {}, ni d'une operation grep ou map. Si les avertissements sont actifs, 
Perl vous avertira si vous faites un redo dans une boucle qui ne se trouve pas dans votre 
portee lexicale courante. 

Un bloc en soi-meme est semantiquement identique a une boucle qui ne s'execute 
qu'une seule fois. Ainsi redo a l'interieur un tel bloc le changera en une construction de 
boucle. Voir la section Controk de boucle au chapitre 4. 

ref E 

ref EXPR 
ref 

L'operateur ref renvoie une valeur vraie si EXPR est une reference, sinon faux. La valeur 
renvoyee depend du type d'objet auquel il est fait reference. Les types integres compren- 
nent : 

SCALAR 

ARRAY 

HASH 

CODE 

GLOB 

REF 

LVALUE 
I0::Handle 

Si l'objet reference a ete consacre (avec bless) dans un paquetage, c'est le nom du pa- 
quetage qui est renvoye. Vous pouvez voir ref comme une sorte d'operateur « typeof ». 

if (ref($r) eq "HASH") { 

print "r est une reference a un hachage.Nn"; 
} elsif (ref($r) eq "Bosse") { # Vilain, voir ci-dessous. 

print "r est une reference a un objet Bosse. \n"; 
} elsif (not ref ($r)) { 

print "r n'est pas du tout une reference. \n"; 

} 

On considere que tester l'egalite de votre classe d'objet avec une classe particuliere est 
une erreur de style OO (oriente objet), puisqu'une classe derivee aura un nom different 
mais devra permettre l'acces aux methodes de la classe de base. II vaut mieux utiliser la 
methode isa de la classe UNIVERSAL comme ceci : 
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if ($r->isa("Bosse")) { 

print "r est une reference a un objet Bosse, ou a une sous-classe. \n"; 

} 

II vaut mieux normalement ne rien tester du tout, puisque le mecanisme OO n'enverra 
pas Fobjet a votre methode sauf s'il pense qu'elle est la plus appropriee. Voir les chapi- 
tres 8 et 12 pour plus de details. Voir aussi la fonction reftype dans le pragma use at- 
tributes au chapitre 31. 



rename s 

rename ANCIEN NOM, NOUVEAU_NOM 

Cette fonction change le nom d'un fichier. Elle renvoie vrai en cas de succes et faux si- 
non. Elle ne fonctionnera pas (normalement) a travers les frontieres des systemes de fi- 
chiers, bien que sur un systeme Unix, la commande mv puisse parfois etre utilisee pour 
compenser cela. Si un fichier nomme NOUVEAU_NOM existe deja, il sera detruit. Les syste- 
mes non-Unix peuvent comporter des restrictions supplementaires. 

Voire le module standard File: :Copy pour renommer les fielders d'un systeme de fi- 
elders a Fautre. 



require H M H DU 

require VERSION 
require EXPR 
require 

Cette fonction exprime une sorte de dependance envers son argument. 

Si l'argument est une chaine, require charge et execute le code Perl trouve dans le fi- 
chier separe dont le nom est donne par la chaine. Ceci est similaire a Fexecution d'un 
do, mis a part que require verifie si le fichier de bibliotheque a deja ete charge et leve 
une exception si un quelconque probleme est rencontre. (On peut done l'utiliser pour 
exprimer des dependances de fichiers sans se soucier d'une duplication de la compila- 
tion.) Comme ses cousines do et use, require sait comment rechercher le chemin d'in- 
clusion, stocke dans le tableau @INC et sait egalement mettre a jour %INC en cas de succes. 
Voir le chapitre 28. 

Le fichier doit renvoyer vrai comme derniere valeur pour indiquer Fexecution reussie 
du code d'initialisation, il est done habituel de terminer ce genre de fichier par un 1;, 
a moins que vous ne soyez surs qu'il renverra vrai de toute facon. 

Si l'argument de require est un numero de version de la forme 5.6.2, require exige que 
la version de Perl entrain d'etre execute soit egale ou superieure a ce numero de version. 
(Perl accepte egalement un nombre a virgule flottante comme 5.005_03 pour une com- 
patibility avec les anciennes versions de Perl, mais cette forme est maintenant fortement 
deconseillee car les foules venant d'autres cultures ne la comprenne pas.) Ainsi, un 
script qui requiert Perl version 5.6 peut commencer par : 

require 5.6.0 # ou require V5.6.0 

et les versions plus anciennes de Perl echoueront. Cependant, comme tous les require, 
la verification est realisee lors de Fexecution. Vous pouvez preferer ecrire use 5.6.0 
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pour un test a la compilation. Voir aussi $PERL_VERSION au chapitre 28. 

Si Fargument de require est le nom denude d'un paquetage (voir package), require 
suppose que le suffixe est automatiquement . pm, facilitant ainsi le chargement de mo- 
dules standard. Cela ressemble a use, mis a part le fait que cela se produit a l'execution 
et non a la compilation et que la methode d'import n'est pas appelee. Par exemple, pour 
charger Socket.pm sans introduire aucun symbole dans le package courant, ecrivez ceci : 

require Socket; # au lieu de "use Socket;" 

Mais on peut toutefois obtenir le meme effet avec ce qui suit, qui procure l'avantage de 
donner des avertissements a la compilation si Socket.pm ne peut etre trouve : 

use Socket (); 

L'utilisation de require sur un nom denude de paquetage remplace egalement tout : : 
dans le nom d'un paquetage par le separateur de repertoires de votre systeme, generale- 
ment /. En d'autres termes, si vous essayez ceci : 

require Machin : :Truc; # un formidable nom denude 

la fonction require cherchera le fichier Machin/Truc.pm dans les repertoires specifies 
par le tableau @INC. Mais si vous essayez cela : 

$classe = 'Machin: :Truc' ; 

require $classe; # $classe n'est pas un nom denude 

ou encore cela : 

require "Machin: :Truc"; # un litteral entre guillemets n'est pas un 
#nom denude 

la fonction require recherchera le fichier Machin : : True dans le tableau @INC et se plain- 
dra de ne pas y trouver Machin : : True. Si cela arrive, vous pouvez faire ceci : 

eval "require $classe"; 

Voir egalement les commandes do FICHIER, use, le pragma use lib et le module stan- 
dard FindBin. 

reset 

reset EXPR 
reset 

On use (ou on abuse) de cette fonction generalement au debut d'une boucle ou dans un 
bloc continue a la fin d'une boucle, pour nettoyer les variables globales ou reinitialiser 
les recherches ?? pour qu'elles puissent a nouveau fonctionner. VEXPR est interpretee 
comme une liste de caracteres uniques (les tirets sont autorises pour les intervalles). 
Toutes les variables scalaires et tous les tableaux et hachages commencant par Fune de 
ces lettres sont remises dans leur etat d'origine. Si VEXPR est omise, les recherches de cor- 
respondance unique {1M0TIF1) sont reinitialisees pour correspondre a nouveau. La 
fonction reinitialise les variables ou les recherches uniquement pour le package cou- 
rant. Elle renvoie toujours vrai. 

Pour reinitialiser toutes les variables en « X » , ecrivez ceci : 
reset 'X'; 
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Pour reinitialiser toutes les variables en minuscules, ecrivez cela : 
reset 'a-z'; 

Enfin, pour ne reinitialiser que les recherches en ??, ecrivez : 
reset; 

La reinitialisation de « A-Z » dans le package principal main n'est pas recommandee car 
les tableaux et hachages ARGV, INC, ENV et SIG seront probablement balayes. 

Les variables lexicales (creees par my) ne sont pas affectees. L'emploi de reset est vague- 
ment deprecie car il efface un peu trop facilement des espaces de noms entiers et parce 
que Foperateur ? ? est lui-meme vaguement deprecie. 

Voir egalement la fonction delete_package() du module standard Symbol et la discus- 
sion entiere sur les compartiments securises dans la section Compartiments securises au 
chapitre 23. 

return H 

return EXPR 
return 

Cet operateur entraine le retour immediat de la sous-routine courante (ou de l'eval ou 
du do FICHIER) avec la valeur specifiee. Toute tentative d'utiliser return en dehors de 
ces trois endroits leve une exception. Remarquez egalement qu'un eval ne peut pas faire 
un return pour le compte de la sous-routine qui a appele l'eval. 

EXPR peut etre evaluee dans un contexte de liste, scalaire ou vide, selon la maniere dont 
la valeur de retour sera utilise, ce qui peut varier d'une execution a l'autre. C'est-a-dire 
que l'expression fournie sera evaluee dans le contexte de l'invocation du sous-program- 
me. Si le sous-programme a ete appele dans un contexte scalaire, EXPR est egalement eva- 
luee dans un contexte scalaire. Si le sous-programme a ete appele dans un contexte de 
liste, EXPR est egalement evaluee dans un contexte de liste. Un return sans argument 
renvoie la valeur scalaire undef dans un contexte scalaire et une liste vide () dans un 
contexte de liste, et (naturellement) rien du tout dans un contexte vide. Le contexte de 
l'appel au sous-programme peut etre determine de l'interieur du sous-programme par 
la fonction (mal nommee) wantarray. 

reverse 

reverse LISTE 

Dans un contexte de liste, cette fonction renvoie une valeur liste composee des elements 
de LISTE dans l'ordre inverse. La fonction peut etre utilisee pour creer des sequences de- 
croissantes : 

for (reverse 1 . . 10) { ... } 

Comme les hachages se transforment en listes quand ils sont passes en tant que LISTE, 
reverse peut egalement etre employee pour inverser un hachage, a supposer que les va- 
leurs soient uniques : 

%machintruc = reverse %trucmachin; 
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Dans un contexte scalaire, la fonction concatene tous les caracteres de LISTE et renvoie 
alors l'inverse, caractere par caractere, de la chame resultante. 

Petite astuce : l'inversion d'une liste triee par une fonction definie par l'utilisateur peut 
parfois etre plus facilement accomplie en triant d'abord la liste dans le sens oppose. 

rewinddir @ @ DO 

rewinddir HANDLE_REPERTOIRE 

Cette fonction se positionne au debut du repertoire pour la routine readdir sur 
HANDLE _REPERTOIRE. La fonction peut ne pas etre disponible sur toutes les machines 
supportant readdir — rewindir meurt si elle n'est pas implementee. Elle renvoie vrai 
en cas de succes, faux sinon. 

rindex 

rindex CHAINE, SOUS_CHAINE, POSITION 
rindex CHAINE, SOUS_CHAINE 

Cette fonction agit exactement comme index mis a part le fait qu'elle renvoie la position 
de la demihe occurrence de SOUS_CHAINE dans CHAINE (un index inverse). La fonction 
renvoie $[ -1 si aucune SOUS_CHAINE n'a ete trouvee. Comme $[ est le plus souvent a 0 
de nos jours, la fonction renvoie presque toujours -1. POSITION, si elle est specifiee, est 
la position la plus a droite qui puisse etre renvoyee. Pour scruter une chaine a Fenvers, 
ecrivez : 

$pos = length $chaine; 

while (($pos = rindex $chaine, $a_chercher, $pos) >= 0) { 
print "Trouve en $pos\n"; 
$pos--; 

} 

rmdir E @ lU 

rmdir REPERTOIRE 
rmdir 

Cette fonction supprime le repertoire specifie par REPERTOIRE si ce repertoire est vide. 
Si la fonction reussit, elle renvoie vrai ; sinon, elle renvoie faux. Voir egalement le mo- 
dule File: :Path si vous voulez d'abord supprimer le contenu du repertoire et si vous 
n'envisagez pas d'appeler le shell avec rm -r, pour une raison ou une autre. (Si par exem- 
ple vous ne disposez pas de shell ou de commande rm, parce que vous n'avez pas encore 
PPT 11 .) 



11. N.d.T. : Perl Power Tools: The Unix Reconstruction Project, un projet dont le but avoue est : « de 
maniere assez simple, de reimplementer le jeu de commandes classiques Unix en Perl pur, et de 
nous amuser autant que possible en faisant cela ». 
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s/// 

L'operateur de substitution. Voir la section Operateurs de correspondance de motif au cha- 
pitre 5. 



scalar 

scalar EXPR 

Cette pseudo-fonction peut etre utilisee dans une LISTE pour forcer EXPR a etre evaluee 
dans un contexte scalaire quand 1'evaluation dans un contexte de tableau produirait un 
resultat different. Par exemple : 

my ($var_suivante) = scalar <STDIN>; 

empeche <STDIN> de lire toutes les lignes depuis l'entree standard avant d'effectuer l'af- 
fectation, puisqu'une affectation a une liste (meme a une my liste) donne un contexte de 
liste. (Sans l'utilisation de scalar dans cet exemple, la premiere ligne de <STDIN> serait 
toujours assignee a $var_suivante, mais les lignes suivantes seraient lues et poubelli- 
sees, puisque la liste a laquelle nous sommes en train d'assigner ne peut recevoir qu'une 
seule valeur scalaire.) 

Bien sur, il serait plus simple et moins encombrant d'enlever les parentheses, transfor- 
mant ainsi le contexte de liste en un contexte scalaire : 

my $var_suivante = <STDIN>; 
Puisqu'une fonction print est un operateur de LISTE, il vous faudrait ecrire : 

print "La longueur est ", scalar (^TABLEAU), "\n"; 
pour afficher la longueur de ^TABLEAU. 

II n'existe aucune fonction « list » correspondant a scalar, puisqu'en pratique, on n'a 
jamais besoin de forcer 1'evaluation dans un contexte de liste. Car toute operation de- 
mandant une LISTE fournit deja un contexte de liste a ses arguments de liste, et ceci gra- 
tuitement. 

Comme scalar est un operateur unaire, si vous utilisez accidentellement une liste entre 
parentheses pour YEXPR, cette derniere se comportera comme une expression scalaire 
avec des virgules, en evaluant tous les elements sauf le dernier dans un contexte vide et 
renvoyant l'element final evalue dans un contexte scalaire. C'est rarement ce que vous 
voulez. La seule instruction suivante : 

print uc (scalar (&machin,$truc)),$bidule; 

est l'equivalent (im)moral de ces deux instructions : 

Smachin; print (uc($truc),$bidule); 

Voir le chapitre 2 pour plus de details sur le separateur virgule. Voir la section Prototypes 
au chapitre 6 pour plus d'informations sur les operateurs unaires. 



seek 

seek HANDL E_ FICHIER, DECALACE, DEPART 
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Cette fonction positionne le pointeur de fichier pour HANDLE_FICHIER, exactement 
comme Fappel d'entree/sortie standard fseek(3). La premiere position dans un fichier 
correspond a un decalage de 0, et non de 1. Les decalages se referent a des positions en 
octets, et non des numeros de ligne. En general, comme les longueurs de ligne varient, 
il n'est pas possible d'acceder a un numero de ligne precis sans lire tout le fichier jusqu'a 
cet endroit, a moins que toutes vos lignes ne soient d'une longueur fixe ou que vous 
ayez construit un index convertissant les numeros de lignes en decalages d'octets. (Les 
memes restrictions s'appliquent aux positions des caracteres dans un fichier avec des en- 
codages de caracteres de longueur variable : le systeme d'exploitation ne sait pas ce que 
sont les caracteres, il ne connait que des octets.) 

HANDLE_FICHIER peut etre une expression dont la valeur donne un veritable nom de 
handle de fichier ou une reference vers quoique ce soit ressemblant a un objet handle 
de fichier. La fonction renvoie vrai en cas de succes, faux sinon. Pour des raisons prati- 
ques, la fonction peut calculer pour vous des decalages depuis diverses positions dans le 
fichier. La valeur de DEPART indique la position a partir de laquelle votre DECALACE com- 
mencera : 0, pour le debut du fichier ; 1, pour la position courante dans le fichier ; ou 
2, pour la fin du fichier. Le DECALACE peut etre negatif pour un DEPART de 1 ou de 2. Si 
vous desirez employer des valeurs symboliques pour DEPART, vous pouvez utiliser 
SEEK_SET, SEEK_CUR et SEEK_END importee depuis les modules 10: :Seekable ou POSIX, 
ou depuis la version 5.6 de Perl, depuis le module Fcntl. 

Si vous voulez connaitre la position dans le fichier pour sysread ou syswrite, n'em- 
ployez pas seek ; les consequences des tampons des entrees/sorties standards rendent la 
position systeme dans un fichier imprevisible et non portable. Utilisez sysseek a la place. 

A cause des regies rigoureuses du C ANSI, vous devez sur certains systemes faire un seek 
a chaque fois que vous basculez entre une lecture et une ecriture. Parmi d'autres effets, 
ceci peut avoir comme consequence d'appeler la fonction clearerr(3) de la bibliotheque 
standard d'entree/sortie. Un DEPART de 1 (SEEK_CUR) avec un DECALAGE de 0 est utile pour 
ne pas bouger de la position courante dans le fichier : 

seek(TEST,0,l); 

Cette fonction s'avere interessante notamment pour suivre la croissance d'un fichier, 
comme ceci : 

for (;;) { 

while (<D0URNAL>) { 

gnoquer($_) # Traiter la ligne courante 

} 

sleep 15; 

seek LOG , 0,1; # RAZ erreur de fin de fichier 

} 

Le seek final reinitialise Ferreur de fin de fichier sans bouger le pointeur. Si cela ne 
fonctionne pas, selon l'implementation de la bibliotheque C d'entrees/sorties standards, 
alors il vous faut plutot ce genre de code : 

for (;;) { 

for ($pos_cour = tell FILE; <FILE>; $pos_cour = tell FILE) { 
gnoquer($_) # Traiter la ligne courante 

} 

sleep $un_moment; 
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seek FILE, $pos_cour, 0; # RAZ erreur de fin de fichier 

} 

Des strategies similaires peuvent etre employees pour conserver les adresses de seek 
pour chaque ligne dans tableau. 

seekdir ® @ no 

seekdir HANDLEREPERTOIRE, POSITION 

Cette fonction fixe la position courante pour le prochain appel a readdir sur 
HANDLE_REPERTOIRE. POSITION doit etre une valeur renvoyee par telldir. Cette fonc- 
tion comporte les mimes dangers relatifs a un possible compactage du repertoire que 
la routine de la bibliotheque systeme correspondante. La fonction peut ne pas etre im- 
plementee partout oil Test readdir. Elle ne Test certainement pas si readdir est absente. 

select (handle de fichier de sortie) @ 

select HANDL E_ FICHIER 
select 

Pour des raisons historiques, il existe deux operateurs select totalement distincts l'un 
de l'autre. La section suivante decrit l'autre. Cette version de l'operateur select renvoie 
le handle de fichier de sortie actuellement selectionne et, si HANDLE_FICHIER est fourni, 
fixe le handle par defaut courant pour la sortie. Cela a deux consequences : d'abord, un 
write ou un print sans handle de fichier s'adressera a ce handle par defaut. Ensuite, les 
variables speciales relatives a la sortie se refereront a ce handle de fichier de sortie. Par 
exemple, s'il faut fixer un format d'en-tete identique pour plus d'un handle de fichier 
de sortie, il vous faudrait faire ceci : 

select RAPP0RT1; 
$ A = , mon_en_tete' ; 
select RAPP0RT2; 
$ A = 'mon_en_tete'; 

Mais remarquez que cela laisse RAPP0RT2 comme handle de fichier actuellement selec- 
tionne. Ce qui est un comportement antisocial condamnable puisque cela peut reelle- 
ment demolir les routines print ou write de quelqu'un d'autre. Les routines de 
bibliotheque bien ecrites laissent le handle de fichier selectionne courant dans l'etat oil 
elles l'ont trouve en entrant. A cet effet, HANDLE_FICHIER peut etre une expression dont 
la valeur donne le nom du veritable handle de fichier. II vous est done possible de sau- 
vegarder et de restaurer le handle de fichier actuellement selectionne : 

my $ancien_hf = select STDERR; $| = 1; select $ancien_hf; 

ou de maniere idiomatique (mais nettement plus absconse) : 

select((select(STDERR), $| = l)[o]) 

Cet exemple fonctionne en construisant une liste composee de la valeur renvoyee par 
select (STDERR) (qui selectionne STDERR par effet de bord) et $ | = 1 (qui est toujours 
1), mais vide le tampon de STDERR, maintenant selectionne, par effet de bord. Le pre- 
mier element de cette liste (le handle de fichier precedemment selectionne) est mainte- 
nant utilise comme un argument vers le select exterieur. Etrange, n'est-ce pas ? C'est ce 
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que vous obtenez quand vous connaissez juste assez de Lisp pour etre dangereux. 

Vous pouvez egalement utiliser le module standard SelectSaver pour restaurer auto- 
matiquement le select precedent a la sortie de la portee. 

Maintenant que nous avons explique tout cela, nous devons souligner que vous n'aurez 
que rarement besoin d'utiliser cette forme de select, car la plupart des variables specia- 
les auxquelles vous pouvez vouloir acceder possedent des methodes d'enrobage orien- 
tees objet. Done, au lieu d'acceder directement a $ | , vous pouvez ecrire : 

use I0::Handle; # Malheureusement, ce *n'"est pas* un petit module 

STDOUT->autoflush(l); 

Et Pexemple precedent de format peut etre code comme suit : 

use 10: :Handle; 

RAPPORTl->format_top_name("mon_en_tete"); 
RAPP0RT2->format_top_name("mon_en_tete"); 



select BITS_LEC, BITSECR, BITSERR, MINUTEUR 

La forme a quatre arguments de select est totalement independante de Foperateur se- 
lect precedemment decrit. Celui-ci sert a decouvrir lesquels (s'il en existe) de vos des- 
cripteurs de fichiers sont prets a effectuer une entree ou une sortie, ou a informer d'une 
condition d'exception. (Ce qui vous evite une scrutation.) Elle appelle l'appel systeme 
sekct{2) avec les masques de bits que vous avez specifies, qui peuvent etre construits gra- 
ce a f ileno et vec, comme ceci : 

$lec_entree = $ecr_entree = $err_entree = "j 
vec($lec_entree J fileno(STDIN), l) = 1; 
vec($ecr_entree, fileno(STDOUT), l) = 1; 
$err_entree = $lec_entree | $ecr_entree; 

Si vous voulez faire un select sur plusieurs handles de fichier, il peut etre preferable 
d'ecrire une routine : 

sub bitshf { 

my @liste_hf = @_; 

my $bits; 

for (@liste_hf) { 

vec($bits, fileno($_), l) = 1; 

} 

return $bits; 

} 

$lec_entree = bits_hf (qw(STDIN TTY MA_S0CK)); 

Si vous desirez utiliser les mimes masques de bits de facon repetitive (et e'est plus effi- 
cace), la maniere la plus courante est : 

($nb_trouveSj $temps_restant) = 

select( $lec_sortie=$lec_entree, $ecr_sortie=$ecr_entree, 
$err_sortie=$err_entree, $minuteur) ; 

Ou pour bloquer jusqu'a ce qu'un descripteur de fichiers soit pret : 
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$nb_trouves = select( $lec_sortie=$lec_entree, $ecr_sortie=$ecr_entree, 
$err_sortie=$err_entree, undef); 

Comme vous pouvez le constater, l'appel de select dans un contexte scalaire renvoie 
seulement $nb_trouves, soit le nombre de descripteurs de fichiers prets trouves. 

L'astuce $ecr_sortie=$ecr_entree fonctionne car la valeur d'une affectation est le cote 
gauche, ce qui fait que $ecr_sortie est d'abord modifie par Paffectation, puis par le se- 
lect, alors que $ecr_entree reste inchange. 

Chaque argument peut egalement valoir undef. Le MINUTEUR, s'il est specifie, est en se- 
condes 12 , et peut eventuellement comporter une virgule. (Un delai de 0 effectue une 
scrutation.) Toutes les implementations ne sont pas capables de renvoyer le 
$temps_restant. Dans ce cas, elles renverront toujours un $temps_restant egal au $mi- 
nuteur fourni. 

Le module standard 10: : Select fournit une interface plus amicale a select, surtout 
parce qu'il effectue pour vous toutes les operations sur les masques de bits. 

Un des emplois possibles de select consiste a endormir un processus avec une resolu- 
tion plus fine que ce qu'admet sleep, ceci en specifiant undef pour tous les masques de 
bits. Ainsi pour vous endormir pendant (au moins) 4,75 secondes, utilisez : 

select undef, undef, undef, 4.75; 

(Le triple undef peut ne pas fonctionner sur certains systemes non-UNIX, et il vous faut 
alors mettre fallacieusement au moins un masque de bits a un descripteur de fichier qui 
ne sera jamais pret.) 

II est dangereux de melanger des entrees/sorties bufferisees (comme read ou <HANDLE>) 
avec select, a l'exception de ce que permet POSIX, et meme dans ce cas, uniquement 
sur les systemes reellement POSIX. Employez plutot sysread. 



semctl no DO 

semctl CLEF, NUM_SEM, CMD, ARC 

Cette fonction invoque l'appel systeme semctl{2) des IPC System V Vous devrez proba- 
blement d'abord faire use IPC : : SysV pour obtenir les definitions de constantes correc- 
tes. Si CMD vaut IPC_STAT ou CETALL, ARC doit alors etre une variable qui contiendra la 
structure semid_ds ou le tableau des valeurs de semaphore qui sont renvoyes. Comme 
pour ioctl et fcntl, les valeurs renvoyees sont undef en cas d'erreur, « 0 but true » 
{NAT. : 0 mais vrai) pour zero ou sinon la valeur reellement renvoyee. 

Voir egalement le module IPC: : Semaphore. Cette fonction n'est disponible que sur les 
systemes supportant les IPC System V 



semget @ GO 

semget CLEF, NB_SEM S, TAILLE, FLAGS 



12. N.d.T. : les anglophones ont la chance de dire timeout, ce qui evite toute confusion dans les 
unites de temps ! 
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Cette fonction invoque Fappel systeme semget{2) des IPC System V Vous devrez proba- 
blement d'abord faire use IPC : : SysV pour obtenir les definitions de constantes correc- 
tes. La fonction renvoie FID du semaphore ou undef en cas d'erreur. 

Voir egalement le module IPC: : Semaphore. Cette fonction n'est disponible que sur les 
systemes supportant les IPC System V 



semop CLEF, CHAINE_0P 

Cette fonction invoque Fappel systeme semop{2) des IPC System V pour realiser des ope- 
rations sur les semaphores, comme signaler ou attendre la liberation. Vous devrez pro- 
bablement d'abord faire use IPC:: SysV pour obtenir les definitions de constantes 
correctes. 

CHAINE_OP doit etre un tableau empaquete de structures semop. Vous pouvez construire 
chaque structure semop en ecrivant pack("s*", $num_sem, $op_sem, $f lags_sem). Le 
nombre d'operations de semaphores est donne par la longueur de CHAINE_OP. La fonc- 
tion renvoie vrai si elle a reussi, faux en cas d'erreur. 

Le code qui suit attend sur le semaphore $num_sem de Fensemble de semaphores identi- 
fie par $id_sem : 

$op_sem = pack "s*", $semnum, -1, 0; 

semop $id_sem, $op_sem or die "Probleme de semaphore : $!\n"; 

Pour envoyer un signal au semaphore, il vous suffit de remplacer -1 par 1. 

Voir egalement le module IPC: Semaphore. Cette fonction n'est disponible que sur les 
systemes supportant les IPC System V 



send SOCKET, MSG, FLAGS, VERS 
send SOCKET, MSG, FLAGS 

Cette fonction envoie un message sur une socket. Elle prend les mimes flags que Fappel 
systeme du mime nom — voir send{2). Sur des sockets non connectees, vous devez spe- 
cifier une destination VERS laquelle envoyer les donnees, ce qui fait que le send de Perl 
fonctionne comme sendto(2). La fonction send renvoie le nombre d'octets envoyes, ou 
undef en cas d'erreur. 

(Certains systemes traitent improprement les sockets comme des objets differents de 
simples descripteurs de fichiers, ce qui vous oblige a toujours utiliser send et recv sur 
les sockets au lieu des operateurs d'entree/sortie standards.) 

Une erreur qu'au moins Fun de nous fait frequemment est de confondre le send de Perl 
avec le send de C en ecrivant : 

send SOCK, $tampon J $length $tampon # FAUX 

Ceci echouera mysterieusement selon le rapport exige par le systeme entre la longueur 
de la chame et les bits de FLAGS. Voir la section Passage de message au chapitre 16 pour 
plus d'exemples. 



semop 



m 



send 



m @ lh 
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setpgrp PID, GRPP 

Cette fonction modifie le groupe de processus courant (GRP_P) pour le PID specifie (em- 
ployez un PID egal a 0 pour le processus courant). L'invocation de setpgrp levera une 
exception sur une machine n'implementant pas setpgrp{2). Attention : certains systemes 
ignoreront les arguments fournis et feront toujours setpgrp(o, $$)}. Ce sont heureu- 
sement les arguments que Ton fournit generalement. Si les arguments sont omis, ils 
vaudront 0,0 par defaut. La version BSD 4.2 de setpgrp n'acceptait aucun argument, 
mais pour BSD 4.4, c'est un synonyme de la fonction setpgid. Pour une meilleure por- 
tability (du moins theorique), utilisez directement la fonction setpgid du module P0- 
SIX. Ou, si vous voulez changer votre script en demon, la fonction POSIX: :setsid() 
peut aussi bien faire l'affaire. Remarquez que la version POSIX de setpgrp n'accepte pas 
d'arguments, seul setpgrp(o,o) est done portable. 



setpriority 0U0I, QUI, PRIORITE 

Cette fonction modifie la PRIORITE courante d'un processus, d'un groupe de processus 
ou d'un utilisateur, tel que specifies par 0U0I et QUI. Voir setpriority (2). Son invocation 
levera une exception sur une machine ou setpriority(2) n'est pas implementee. Pour faire 
un nice sur votre processus de quatre unites vers le bas (la mime chose que d'executer 
votre programme avec m'ce(l)), essayez : 

setpriority 0, 0, getpriority(0, 0) + A; 

^interpretation d'une priorite donnee peut varier d'un systeme d'exploitation a l'autre. 
Certaine priorites ne sont pas accessibles aux utilisateurs sans privileges. 

Voir egalement le module BSD: : Resource de CPAN. 



setsockopt SOCKET, NIVEAU, N0M_0PTI0N, VALEUR_0PTI0N 

Cette fonction applique l'option de socket requise. La fonction renvoie undef en cas 
d'echec. NIVEAU specifie quelle couche de protocole est visee par l'appel, ou S0L_S0CKET 
pour la socket elle-meme qui se trouve au sommet de toutes les couches. VALEUR_0PTI0N 
peut etre undef si vous ne voulez pas passer d'argument. II est courant d'appliquer l'op- 
tion S0_REUSEADDR, pour contourner le fait que Ton ne peut pas faire de bind vers une 
adresse donnee alors que la connexion TCP precedente sur ce port est toujours en train 
de se demander s'il faut en finir. Cela peut ressembler a ceci : 

use Socket; socket (SOCK, ...) 

or die "Impossible de creer une socket : $!\n"; 
setsockopt(S0CK, S0L_S0CKET, S0_REUSEADDR, l) 

or warn "setsockopt impossible : $!\n"; 

Voir setsockopt(2) pour les autres valeurs possibles. 



setpriority 
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shift 

shift TABLEAU 
shift 

Cette fonction enleve la premiere valeur du tableau et la renvoie, reduisant ainsi le ta- 
bleau d'un element et deplacant toutes les autres d'une unite vers le bas. (Ou vers le 
haut, ou vers la gauche, selon votre vision du tableau. Nous aimons bien vers la gauche.) 
S'il n'y a pas d'elements dans le tableau, la fonction renvoie undef. 

Si TABLEAU est omis, la fonction decale @_ dans la portee lexicale des sous-programmes 
et des formats ; elle decale @ARGV dans les portees de fichiers (generalement, le program- 
me principal) ou a l'interieur de la portee lexicale etablie par les constructions eval 
CHAINE, BEGIN {}, CHECK {}, INIT {} et END {}. 

Les sous-programmes commencent souvent par recopier leurs arguments dans des va- 
riables lexicales et peuvent utiliser shift pour ce faire : 

sub marine { 

my $brasse = shift; # profondeur 13 

my $poissons = shift; # nombre de poissons 

my $o2 = shift; # concentration en oxygene 

# ... 

} 

shift est egalement employe pour traiter les arguments au debut de votre programme : 

while (defined($_ = shift)) { 

/ A [ A -]/ && do { unshift @ARGV, $_; last }; 

/ A -w/ && do { $AVERTISSEMENTS = 1; next }; 

/ A -r/ && do { $RECURSION = 1; last }; 

die "Argument inconnu $_\n"; 

} 

Vous pouvez egalement considerer les modules Getopt : : Std et GetOpt : : Long pour trai- 
ter les argument de votre programme. 

Voir egalement unshift, push, pop et splice. Les fonctions shift et unshift font la 
meme chose a l'extremite gauche d'un tableau que push et pop a l'extremite droite. 



shmctl go go 

shmctl ID, CMD, ARC 

Cette fonction invoque l'appel systeme shmctl{2) des IPC System V Vous devrez probable- 
ment d'abord faire use IPC: :SysV pour obtenir les definitions de constantes correctes. 

Si CMD vaut IPC_STAT, ARC doit alors etre une variable qui contiendra la structure 
shmid_ds renvoyee. Comme pour ioctl et f cntl, les valeurs renvoyees sont undef en 
cas d'erreur, « 0 but true » (N.d. T. : 0 mais vrai) pour zero ou sinon la valeur reellement 
renvoyee. 

Cette fonction n'est disponible que sur les systemes supportant les IPC System V 



13. N.d.T. : unite egale a 1828 mm. 
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shmget go go 

shmget CLEF, FAILLE, FLAGS 

Cette fonction invoque l'appel systeme shmget(2) des IPC System V La fonction renvoie 
FID du segment de memoire partagee ou undef en cas d'erreur. Avant l'appel, faites use 
IPC::SysV 

Cette fonction n'est disponible que sur les systemes supportant les IPC System V 



shmread @ do 

shmread ID, VAR, POS, FAILLE 

Cette fonction lit depuis FID de segment de memoire partagee en commencant a la po- 
sition POS sur la longueur FAILLE (en s'y attachant, puis en copiant les donnees qui s'y 
trouvent et enfin en s'en detachant). VAR doit etre une variable qui contiendra les don- 
nees lues. La fonction renvoie vrai en cas de reussite et faux en cas d'erreur. 

Cette fonction n'est disponible que sur les systemes supportant les IPC System V 

shmwrite m LU 

shmwrite ID, CHAINE, POS, FAILLE 

Cette fonction ecrit sur YID de segment de memoire partagee en commencant a la po- 
sition POS sur la longueur FAILLE (en s'y attachant, puis en y copiant des donnees et en- 
fin en s'en detachant). Si CHAINE est trop longue, seulement FAILLE octets seront 
utilises ; si FAILLE est trop courte, des caracteres nuls sont ecrit pour remplir FAILLE oc- 
tets. La fonction renvoie vrai en cas de reussite et faux en cas d'erreur. 

Cette fonction n'est disponible que sur les systemes supportant les IPC System V (Vous 
etes certainement fatigues de lire ceci — nous commencons a etre fatigues de l'ecrire.) 



shutdown @ @ m 

shutdown SOCKEF, COMMENF 

Cette fonction arrete une connexion socket de la maniere indiquee par COMMENF. Si COM- 
MENF vaut 0, toute reception ulterieure est interdite. Si COMMENF vaut 1, toute emission 
ulterieure est interdite. Si COMMENF vaut 2, tout est interdit. 

shutdown(SOCK, 0); # plus de lectures 
shutdown(SOCK, l); # plus d'ecritures 
shutdown(SOCK, 2); # plus du tout d'entrees/sorties 

Ceci est utile avec les sockets lorsque vous voulez prevenir l'autre cote que vous avez fini 
d'ecrire mais pas de lire, ou vice versa. C'est egalement une forme plus determinee de 
fermeture car elle empeche toute copie de ces descripteurs detenus par des processus 
forkes. 

Imaginez un serveur qui veut lire la requete de son client jusqu'a la fin de fichier, puis 
envoyer une reponse. Si le client appelle close, cette socket n'est maintenant plus valide 
pour les entrees/sorties, aucune reponse ne pourra done etre renvoyee. A la place, le 
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client doit utiliser shutdown pour fermer la moitie de la connexion : 
print SERVEUR, "ma requete\n"; # envoi de donnees 

shutdown(SERVEUR, l); # envoi de fin de ligne; plus d'ecritures 

$reponse = <SERVEUR>; # mais vous pouvez encore lire 

(Si vous etes arrive ici pour savoir comment arreter un systeme, vous devrez executer 
un programme externe a cet effet. Voir system.) 

sin B 

sin EXPR 
sin 

Desole, meme si cet operateur evoque des choses malicieuses aux anglophones 14 , il ne 
fait que renvoyer le sinus de EXPR (exprimee en radians). 

Pour l'operation inverse,vous pouvez utiliser la fonction asin des modules Math: :Trig 
ou POSIX, ou utiliser cette relation : 

sub asin { atan2($_[0], sqrt(l - $_[o] * $_[0])) } 

sleep 

sleep EXPR 
sleep 

Cette fonction endort le script pendant EXPR secondes, ou eternellement si EXPR est omi- 
se. Elle renvoie le nombre de secondes reellement passees a dormir. Elle peut etre inter- 
rompue en envoyant un signal SIGALRM au processus. Sur certains systemes anciens, le 
repos peut durer jusqu'a une seconde de moins que ce que demandiez, selon la maniere 
de compter les secondes. La plupart des systemes modernes dorment toujours durant la 
periode entiere. lis peuvent cependant sembler dormir plus que cela, car Fordonnan- 
ceur d'un systeme multitaches peut ne pas donner tout de suite la main a votre proces- 
sus. S'il est disponible, l'appel select (descripteurs de fichiers prets) peut vous donner 
une meilleure resolution. Vous pouvez egalement employer syscall pour appeler les 
routines getitimer(2) et setitimer(2) supportee par certains systemes Unix. Vous ne pou- 
vez probablement pas melanger des appels a alarm avec ceux a sleep, car sleep est sou- 
vent implemente en utilisant alarm. 

Voir egalement la fonction sigpause du module POSIX. 

socket 

socket SOCKET, DOMAIN E, TYPE, PROTOCOLE 

Cette fonction ouvre une socket du type specifie et Fattache au handle de fichier SOCKET. 
DOMAIN, TYPE et PROTOCOLE sont specifies comme pour socket(2). Si le handle de fichier 
SOCKET est indefmi, il sera autovivifie. Avant d'utiliser cette fonction, votre programme 
doit contenir la ligne : 

use Socket; 



14. N.d.T. : en anglais « sin » signifie « peche ». 
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Cela vous donne acces aux constantes appropriees. La fonction renvoie vrai en cas de 
reussite. Vois les exemple dans la section « Sockets » au chapitre 16. 

Sur les systemes qui supportent le flag close-on-exec pour les fichiers, ce flag sera posi- 
tionne pour le nouveau descripteur de fichier ouvert, comme le determine la valeur de 
$ A F. Voir la variable $ A F ($SYSTEM_FD_MAX) au chapitre 28. 



socketpair S0CKET1, S0CKET2, DOMAINE, TYPE, PR0T0C0LE 

Cette fonction cree une paire de sockets non nominees dans le domaine specifie, d'un 
type specifie. DOMAINE, TYPE et PROTOCOLE sont specifies de la meme maniere que pour 
socketpair{2). Si Fun des arguments sockets (SOCKETl ou S0CKET2) est indefini, il sera 
autovivifie. La fonction renvoie vrai en cas de succes, sinon faux. Sur un systeme oil soc- 
ketpair(2) n'est pas implements, l'appel a cette fonction leve une exception. 

Cette fonction est generalement utilisee juste avant un fork. L'un des processus resul- 
tants doit fermer SOCKETl et l'autre SOCKETL Vous pouvez utiliser ces sockets de maniere 
bidirectionnelle, au contraire des handles de fichiers crees par la fonction pipe. Certains 
systemes definissent pipe en termes de socketpair, auquel cas un appel a pipe(Lec, 
Ecr) est equivalent pour Fessentiel a : 

use Socket; 

socketpair(Lec, Ecr, AFJJNIX, SOCKSTREAM, PFUNSPEC); 
shutdown(Lec, i); # plus d'ecritures pour le lecteur 

shutdown(Ecr, 0); # plus de lectures pour l'ecrivain 

Sur les systemes qui supportent le flag close-on-exec pour les fichiers, ce flag sera posi- 
tionne pour le nouveau descripteur de fichier ouvert, comme le determine la valeur de 
$ A F. Voir la variable $ A F ($SYSTEM_FD_MAX) au chapitre 28. Voir egalement l'exemple a 
la fin de la section Communication bidirectionnelle au chapitre 16. 



sort SUB_UTILISATEUR LISTE 
sort BLOC LISTE 
sort LISTE 

Cette fonction trie la LISTE et renvoie la valeur liste triee. Elle trie par defaut dans le 
sens de comparaison standard des chaines (les valeurs indefinies etant triees avant les 
chaines vides definies, qui sont triees avant tout le reste). Lorsque le pragma use locale 
est actif, sort LISTE trie LISTE selon la locale courante LC_COLLATE. 

SUB_UTILISATEUR, s'il est specifie, est le nom d'un sous-programme qui renvoie un en- 
tier inferieur, egal ou superieur a 0, selon la maniere dont les elements du tableau doi- 
vent etre ordonnes. (Les operateurs <=> et cmp peuvent etre utilises pour effectuer 
facilement des comparaisons de nombres et de chaines pouvant donner trois resultats.) 
Si un SUBJJTILISATEUR est donne mais que cette fonction est indefinie, sort leve une 
exception. 

Pour des raisons d'efficacite, le code d'appel normal des sous-programmes est court-cir- 
cuite, ce qui a pour consequences que : le sous-programme ne peut pas etre recursif (ni 



socketpair 



sort 
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contenir d'operateur de controle de boucle qui vous ferait sortir du bloc ou de la routi- 
ne) et que les deux elements a comparer lui sont passes non via @_, mais en positionnant 
temporairement les variables globales par $a et $b dans le paquetage oil sort a ete com- 
pile (voir les exemples ci-dessous). Les variables $a et $b etant passees en tant qu'alias des 
valeurs reelles, ne les modifiez pas dans le sous-programme. 

Le sous-programme de comparaison doit bien se comporter. S'il renvoie des resultats in- 
consistants (en disant un jour que $x[i] est inferieur a $x[2] et en pretendant le con- 
traire le lendemain), les consequences sont aleatoires. (C'est une autre raison de ne pas 
modifier $a et $b.) 

SUB_UTILISATEUR peut etre un nom de variable scalaire (non indicee), dont la valeur 
fournit le nom du sous-programme a utiliser. (Un nom symbolique plutot qu'une refe- 
rence en dur est autorise mime lorsque le pragma use strict ' ref s ' est actif.) En lieu 
et place de SUB_UTILISATEUR, on peut fournir un BLOC, sorte de sous-programme ano- 
nyme en ligne. 

Pour un tri numerique ordinaire, ecrivez ceci : 

sub numerique { $a <=> $b } 

@tri_par_nombre = sort numerique 53,29,11,32,7; 

Pour trier dans l'ordre decroissant, il vous suffit d'appliquer reverse apres le sort, ou 
d'inverser l'ordre de $a et $b dans le sous-programme de tri : 

@decroissant = reverse sort numerique 53,29,11,32,7; 

sub inverse_numerique { $b <=> $a } 

@decroissant = sort inverse_numerique 53,29,11,32,7; 

Pour trier des chames sans tenir compte de la casse (majuscules/minuscules), passez $a 
et $b a lc avant la comparaison : 

@desordonnee = qw/moineau Autruche ALOUETTE moqueurchat geaiBLEU/; 
(Sordonnee = sort { lc($a) cmp lc($b) } @desordonnee; 

(Avec Unicode, l'emploi de lc pour la canonisation de la casse est plus ou moins prefe- 
rable a l'utilisation de uc car certaines langues differencient les majuscules pour les ti- 
tres des majuscules ordinaires. Mais cela ne compte pas pour un tri ASCII basique, et si 
vous voulez trier convenablement de FUnicode, vos routines de canonisation seront 
bien plus imaginatives que lc.) 

Le tri des valeurs d'un hachage est une utilisation courante de la fonction sort. Par 
exemple, si un hachage %montant_ventes enregistre les ventes de differents services, une 
recherche dans le hachage a l'interieur de la routine de tri permet aux clefs du hachage 
d'etre triees selon leurs valeurs correspondantes : 

# tri dans l'ordre decroissant des ventes par service 

sub par_vente { $montant_ventes{$b} <=> $montant_ventes{$a} } 

for $serv (sort parvente keys %montant_ventes) { 
print "$serv => $montant_ventes{$serv}\n"; 

} 

Vous pouvez effectuer des niveaux supplementaires de tri en faisant des comparaisons 
en cascade a l'aide des operateurs | | ou or. Cela marche parfaitement car les operateurs 
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de comparaison renvoient convenablement 0 pour une equivalence, ce qui les fait en- 
trer dans la comparaison suivante. Ici les clefs de hachage sont triees tout d'abord selon 
les montants des ventes associees puis selon les clefs elles-memes (dans le cas ou deux 
departements ou plus auraient le meme montant de ventes) : 

sub parventepuisserv { 

$montant_ventes{$b} <=> $montant_ventes{$a} 



} 



$a cmp $b 



for $serv (sort par_vente_puis_serv keys %montant_ventes) { 
print "$serv => $montant_ventes{$serv}\n"; 

} 

En supposant que @enregs est un tableau de references sur des hachages, dans lequel 
chaque hachage comporte des champs comme PRENOM, NOM, ACE, TAILLE et SALAIRE, la 
routine suivante met au debut de la liste triee les enregistrements pour les personnes 
les plus riches, puis les plus grandes, ensuite les plus jeunes et enfin les premieres dans 
l'ordre alphabetique : 

sub prospecte { 

$b->{SALAIRE} <=> $a->{SALAIRE} 
II 

$b->{TAILLE} <=> $a->{TAILLE} 
II 

$a->{AGE} <=> $b->{ACE} 
II 

$a->{N0M} cmp $b->{N0M} 
II 

$a->{PREN0M} cmp $b->{PREN0M} 

} 

@triee = sort prospecte (Senregs; 

Toute information utile qui derive de $a et de $b peut servir de base a une comparaison 
dans une routine de tri. Par exemple, si les lignes d'un texte doivent etre triees selon des 
champs particuliers, split peut etre utilise dans la routine de tri pour deriver les 
champs : 

(Slignesjtriees = sort { 

|5>champs_a = split /:/, $a; # champs separes par deux points 



@champs_b = split /:/, $b; 

$champs_a[3] <=> $champs_b[3] 
II" 

$champs_a[o] cmp $champs_b[o] 
II" 

$champs_b[2] <=> $champs_a[2] 



# tri numerique sur le 4eme champ, puis 

# tri de chaines sur le ler champ, puis 



# tri numerique decroissant sur le 3eme 
I # champ 

# etc. 

} |5)lignes; 

Toutefois, puisque sort execute la routine de tri plusieurs fois en utilisant differentes 
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paires de valeurs pour $a et $b, l'exemple precedent redecoupera chaque ligne avec 
split plus souvent que necessaire. 

Pour eviter le cout de derivations repetees comme l'eclatement de lignes pour comparer 
leurs champs, executez la derivation une seule fois par valeur avant le tri et sauvegardez 
Finformation derivee. Ici, on cree des tableaux anonymes pour encapsuler chaque ligne 
ainsi que le resultat de son eclatement : 

gtemp = map { [$_, split /:/] } @lignes; 

Puis, on trie les references du tableau : 

@temp = sort { 

(5)champs_a = @$a[l. .$#$a]; 
@champs_b = @$b[l. .$#$b]; 

$champs_a[3] <=> $champs_b[3] # tri numerique sur le 4eme champ, puis 
II 

$champs_a[o] cmp $champs_b[o] # tri de chaines sur le ler champ, puis 
II 

$champs_b[2] <=> $champs_a[2] # tri numerique decroissant sur le 3eme 
\ # champ 

# etc. 

} @temp; 

Maintenant que les references du tableau sont triees, on peut recuperer les lignes d'ori- 
gine a partir des tableaux anonymes : 

|5>lignes_triees = map { $_->[o] } gternp; 

Si Ton rassemble tout cela, cette technique map-sort-map, souvent appelee transforma- 
tion schwartzienne 15 , peut etre accomplie en une seule instruction : 

(5)lignes_triees= map { $_->[o] } 
sort { 

@champs_a = @$a [ 1 . . $#$a ] ; 
@champs_b = @$b[l. .$#$b]; 

$champs_a[3] <=> $champs_b[3] 
II 

$champs_a[o] cmp $champs_b[o] 
II 

$champs_b[2] <=> $champs_a[2] 
II 

} 

map { [$_, split /:/] } @lignes; 

Ne declarez pas $a et $b en tant que variables lexicales (avec my). Elles sont globales au 
paquetage (bien qu'exemptes des restrictions habituelles concernant les variables globa- 
les lorsque vous employez use strict). Vous devez cependant vous assurer que la rou- 



15. N.d.T. : du nom de l'illustre co-auteur des precedentes editions de cet ouvrage : Randal L. 
Schwartz. 
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tine de tri se trouve bien dans le meme package, ou sinon qualifier $a et $b avec le nom 
du paquetage de l'appelant (voir la fonction caller). 

Ceci etant dit, dans la version 5.6, vous pouvez ecrire des sous-programmes de tri avec la 
methode standard de passage d'arguments (et , sans coincidence aucune, utiliser des 
sous-programmes XS comme routines de tri), pourvu que vous declariez le sous-pro- 
gramme de tri avec un prototype valant ( $$) . Et dans ce cas, vous pouvez en fait declarer 
$a et $b comme variables lexicales : 

sub numerique ($$) { 
my ($a, $b) = @_; 
$a <=> $b; 

} 

Et un jour ou Fautre, lorsque des prototypes complets auront ete implemented, vous 
ecrirez seulement : 

sub numerique ($a, $b) { $a <=> $b } 

et nous serons alors plus ou moins revenus a notre point de depart. 



splice TABLEAU, DECALAGE, LONGUEUR, LISTE 
splice TABLEAU, DECALAGE, LONGUEUR 
splice TABLEAU, DECALAGE 
splice TABLEAU 

Cette fonction enleve les elements designes par DECALAGE et LONGUEUR dans un TABLEAU, 
et les remplace par les elements de LISTE, s'il en existe. Si DECALAGE est negatif, la fonc- 
tion compte a rebours depuis la fin du tableau, mais si cela vous faisait atterrir avant le 
debut du tableau, une exception est levee. Dans un contexte de liste, splice renvoie les 
elements supprimes du tableau. Dans un contexte scalaire, elle renvoie le dernier ele- 
ment enleve ou undef s'il n'y en a pas. Si le nombre de nouveaux elements n'est pas egal 
au nombre d'anciens elements, le tableau augmente ou diminue en taille selon les be- 
soms, et la position des elements qui suivent cette tranche ajoutee ou enlevee est decalee 
en consequence. Si LONGUEUR est omise, la fonction enleve tout a partir de DECALAGE. Si 
DECALAGE est omis, le tableau est vide au fur et a mesure qu'il est lu. Les colonnes sui- 
vantes sont equivalentes (a supposer que $ [ vaille 0) : 



Methode directe 


Equivalent splice 


push(|5)a J $x, $y) 


splice(@a, @a, 0 


$y) 


pop(@a) 


splice(@a, -l) 




shift (@a) 


splice(@a, 0, l) 




unshift(@a, $x, $y) 


splice((Sa, 0, 0, 


$x, $y) 


$a[$x] = $y 


splice(@a, $x, 1. 


$y) 


(@a, @a =()) 


splice(@a) 





La fonction splice peut egalement servir a decouper la liste d'arguments passee a un 
sous-programme. En supposant par exemple que les longueurs de liste sont passees 
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avant les listes elles-memes : 



sub 



eqliste { # compare deux valeurs de liste 

my @a = splice(|5)_ J o, shift); 

my @b = splice(|5)_ J 0, shift); 

return 0 unless @a == @b; # meme longueur ? 

while (@a) { 



return 0 if pop(@a) ne pop(@b); 

} 

return 1; 



} 



if (eq_liste($long, @machin[l. .$long], scalar (@truc), @truc)) { } 

Toutefois, il serait probablement plus propre de se contenter d'utiliser des references sur 
des tableaux pour faire cela. 



split /MOTIF/, EXPR, LI MITE split /MOTIF/, EXPR 

split /MOTIF/ 

split 

Cette fonction recherche des delimiteurs dans une chaine EXPR et l'eclate en une liste de 
sous-chaines, en renvoyant la valeur liste resultante dans un contexte de liste, ou le nom- 
bre de sous-chames dans un contexte scalaire. 16 Les delimiteurs sont determines par la 
correspondance repetee d'un motif, en utilisant l'expression reguliere donnee dans MO- 
TIF. Les delimiteurs peuvent done etre de n'importe quelle taille et ne sont pas force- 
ment la meme chaine a chaque recherche. (Les delimiteurs ne sont generalement pas 
renvoyes, mais voyez les exceptions ci-dessous.) Si le MOTIF ne correspond a rien, split 
renvoie la chaine d'origine comme une sous-chaine unique. S'il trouve une occurrence, 
vous obtenez deux sous-chaines, et ainsi de suite. Vous pouvez donner au MOTIF des mo- 
dificateurs d'expressions regulieres, comme /MOTIF/i, /MOTIF Vx, etc. Lorsque vous ecla- 
tez avec un motif valant / A /, le modificateur //m est implicite. 

Si LIMITE est specifiee et positive, la fonction eclate la chaine en, au plus, ce nombre de 
champs (bien qu'elle puisse l'eclater en moins si elle ne trouve pas assez de delimiteurs). 
Si LIMITE est negative, elle est traitee comme si une LIMITE arbitrairement grande avait 
ete specifiee. Si LIMITE est omise, les champs nuls qui restent sont elimines du resultat 
(ce dont les utilisateurs potentiels de pop feraient bien de se souvenir). Si EXPR est omise, 
la fonction eclate la chaine $_. Si MOTIF est egalement omis ou s'il s'agit d'un espace lit- 
teral, " ", la fonction eclate sur les caracteres d'espacement, /s+/, apres avoir elimine 
tout espacement en debut de chaine. 

On peut eclater des chaines de n'importe quelle longueur : 

gears = split //, $mot; 

|9champs = split /:/, $ligne; 

(Smots = split " ", $paragraphe; 

(cOlignes = split / A /, $tampon; 



16. Un contexte scalaire entraine egalement le fait que split ecrive son resultat dans @_, mais cet 
usage est deprecie. 
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Un motif capable de correspondre soit a la chaine vide, soit a quelque chose de plus long 
que la chaine vide (par exemple, un motif compose d'un seul caractere modifie par un 
* ou un ?) eclatera la valeur de EXPR en caracteres separes partout oil il correspond a la 
chaine vide entre les caracteres ; les correspondances non-nulles passeront outre les oc- 
currences du delimiteur comme habituellement. (En d'autres termes, un motif ne trou- 
vera pas de correspondance en plus d'un endroit, meme avec une longueur de zero.) Par 
exemple : 

print join split / */, 'a la votre'; 

produira « a : 1 : a : v : o : t : r : e ». Les espaces ont disparu car ils ont provoque une corres- 
pondance non-nulle. Dans un cas trivial, le motif nul // se contente d'eclater la chaine 
en caracteres separes, et les espaces ne disparaissent pas. (Pour une correspondance de 
motif normale, un motif // repeterait le dernier motif de correspondance reussie, mais 
le motif de split ne tombe pas dans cette crevasse.) 

Le parametre LIMITE peut etre utilise pour n'eclater qu'une partie d'une chaine : 

($login, $mot_de_passe, $reste) = split /:/, $_, 3; 

Nous vous encourageons a eclater des listes de noms comme ceci afin d'autodocumen- 
ter votre code. (Pour des raisons de verification d'erreurs, remarquez que $reste serait 
indefini s'il y avait moins de 3 champs.) Quand une liste se voit assigner une valeur, si 
LIMITE est omise, Perl fournit une LIMITE superieure de 1 au nombre de variables de la 
liste pour eviter un travail inutile. Pour la liste ci-dessus, LIMITE aurait ete de 4 par de- 
faut, et $reste n'aurait recu que le troisieme champ et non le reste de la ligne. Dans des 
applications oil le temps compte, il vaut mieux ne pas eclater en plus de champs que ce 
dont vous avez vraiment besoin. (Le probleme avec les langages puissants, c'est qu'ils 
vous laissent parfois etre des idiots en puissance.) 

Nous avons dit plus haut que les delimiteurs n'etaient pas renvoyes, mais si le MOTIF 
contient des parentheses, les champs habituellement renvoyes viennent s'intercaler en- 
tre chaque occurrence des delimiteurs entre parentheses qui est egalement inclue dans 
la liste resultante. Voici un exemple simple : 

split /([-,])/, "1-10,20"; 

produit la valeur de liste : 

(l, 10, V, 20) 

S'il y a plus de parentheses, un champ est renvoye pour chaque paire, meme si certaines 
ne donnent pas de correspondances, auquel cas des valeurs indefinies sont renvoyees a 
ces positions. Ainsi, si vous ecrivez : 

split /(-)](,)/, "1-10,20"; 

vous obtiendrez la valeur : 

(1, undef, 10, undef, ' ,' , 20) 

L'argument /MOTIF/ peut etre remplace par une expression specifiant les motifs qui va- 
rient a l'execution. Comme pour les motifs ordinaires, pour ne compiler a l'execution 
qu'une seule fois, utilisez /$variable/o. 

II existe un cas special oil la specification d'un espace unique (" ") eclate sur les caracte- 
res d'espacement tout comme split sans argument, split (" ") peut done etre utilise 
pour emuler le comportement de awk par defaut. Alors qu'au contraire split(/ /) 
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vous donnera autant de champs nuls initiaux qu'il existe d'espaces en en-tete. (Par 
ailleurs, si Ton fournit une chaine au lieu d'une expression rationnelle, elle sera de route 
facon interpreted comme une expression rationnelle.) Vous pouvez utiliser cette pro- 
priete pour supprimer les espaces au debut et a la fin d'une chaine et pour rassembler 
les sequences de caracteres d'espacement consecutifs en un seul espace : 

$chaine = join( J ' , split(' $chaine)); 

L'exemple suivant eclate un en-tete de message RFC-822 en un hachage contenant $te- 
te{$Date}, $tete{Subject}, et ainsi de suite. II utilise l'astuce d'assigner une liste de 
paire a un hachage, en se basant sur le fait que les delimiteurs alternent avec des champs 
delimites. II emploie les parentheses pour renvoyer les parties de chaque delimiteur 
comme faisant partie de la valeur de liste renvoyee. Comme le motif de split garantit 
le renvoi des elements en paires par la vertu de contenir un seul jeu de parentheses, l'af- 
fectation du hachage est sur de recevoir une liste composee de paires clef/valeur, oil cha- 
que clef est le nom d'un champ d'en-tete. (Cette technique fait malheureusement 
perdre des informations sur plusieurs lignes avec le meme champ de clef, comme les li- 
gnes Received-By. Ah, et puis zut. . . .) 

$entete =~ s/\n\s+/ /g; # Reunit les lignes de continuation. 
%tete = ('PREAMBULE' , split /^(\S*?) : \s*/m_, $entete); 

L'exemple suivant traite les entrees d'un fichier \Jnixpasswd(5). Vous pourriez eviter le 
chomp, auquel cas $shell se terminerait par un saut de ligne. 

open MOT_DE_PASSE, Vetc/passwd' ; 

while (<MOT_DE_PASSE>) { 

chomp; # supprime le saut de ligne final 
($login, $mot_de_passe, $uid, $gid, $nom_reel, $rep, $shell) = 
split /:/; 

} 

Voici comment traiter chaque mot de chaque ligne de chaque fichier d'entree pour 
creer un hachage des frequences de mots : 

while (<>) { 

foreach $mot (split) { 
$compteur{$mot}++; 

} 

} 

L'inverse de split est effectue par join (sauf que join ne peut joindre qu'avec le meme 
delimiteur entre tous les champs). Pour eclater une chaine sur des champs de longueur 
fixe, employez unpack. 

sprintf 

sprintf FORMAT, LISTE 

Cette fonction renvoie une chaine formatee suivant les conventions habituelles de 
printf gouvernees par la fonction sprintf de la bibliotheque C. Voir sprintf (3) ou printf 
(3) sur votre systeme pour une explication des principes generaux. La chaine FORMAT 
contient du texte comprenant des specificateurs de champs auxquels les elements de 
LISTE sont substitues, a raison d'un element par champ. 
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Perl realise son propre formatage pour sprintf — il emule la fonction C sprintf, mais il 
ne l'utilise pas. 17 II en resulte que toutes les extensions non-standard dans votre fonc- 
tion sprintf (3) locale ne sont pas accessibles depuis Perl. 

Le sprintf de Perl permet d'utiliser les conversions universellement connues qui sont 
montrees dans le tableau 29-4. 

Tableau 29-4. Formats pour sprintf 



Champ 


Signification 


%% 


Un signe pourcent. 


%c 


Un caractere avec le nombre donne. 


%s 


Une chaine. 


%d 


Un entier signe, en decimal. 


%u 


Un entier non-signe, en decimal. 


%o 


Un entier non-signe, en octal. 


%x 


Un entier non-signe, en hexadecimal. 


%e 


Un nombre a virgule flottante, en notation scientifique. 


%f 


Un nombre a virgule flottante, en notation decimale fixe. 


Xg 


Un nombre a virgule flottante, en notation %e ou %f. 


De plus, Perl permet d'utiliser les conversion suivantes, largement supportees : 


Champ 


Signification 


%X 


Comme %x, mais avec des lettres majuscules. 


%E 


Comme %e, mais avec un « E » majuscule. 


%G 


Comme %g, mais avec un « E » majuscule (si c'est applicable). 


%b 


Un entier non-signe, en binaire. 


%p 


Un pointeur (affiche l'adresse de la valeur Perl en hexadecimal). 


%n 


Special : sauvegarde le nombre de caracteres de sortie jusque la dans la 




prochaine variable de la liste d'arguments. 



Enfin, pour une compatibilite anterieure (et nous voulons vraiment dire 
« anterieure »), Perl permet d'utiliser ces conversions inutiles mais largement suppor- 
tees : 



Champ 


Signification 


%i 


Un synonyme pour %d. 


%D 


Un synonyme pour %ld. 



17. Mise a part pour les nombres a virgule flottante, et meme dans ce cas, seulement les modifi- 
cateurs standards sont autorises. 
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Champ 


Signification 


%U 


Un synonyme pour %lu. 


%0 


Un synonyme pour %lo. 


%F 


Un synonyme pour %f . 


Perl permet d'utiliser les flags suivants universellement connus entre le % et le caractere 


de conversion : 


Flag 


Signification 


espace 


Prefixe un nombre positif par un espace. 


+ 


Prefixe un nombre positif par un signe plus. 




Justifie le champ vers la gauche. 


0 


Utilise des zeros, et non des espaces, pour justifier vers la droite. 


# 


Prefixe un octal non nul par "0" et un hexadecimal non nul par "Ox". 


nombre 


Largeur minimale du champ. 


.nombre 


« Precision » : chiffres apres la virgule pour les nombres a virgule flot- 




tante, longueur maximale pour les chaines, longueur minimale pour les 




entiers. 


1 


Interprete Tender comme un type C long ou unsigned long. 


h 


Interprete l'entier comme un type C short ou unsigned short (si aucun 




flag n'est fourni, l'entier est interprete comme un type C int ou unsi- 




gned). 


11 existe egalement ces deux flags specifiques a Perl : 


Flag 


Signification 


V 


Interprete l'entier comme le type entier standard de Perl. 


V 


Interprete la chaine comme un vecteur d'entiers, affiches comme des 




nombres separes soit par des points, soit par une chaine arbitraire recue 




depuis la liste d'arguments lorsque le flag est precede par *. 



Si votre Perl connait les « quads » (entiers de 64 bits) soit parce que la plate-forme les 
supporte nativement, soir parce que Perl a ete specialement compile avec cette possibi- 
lite, alors les caracteres duoxXbiDUO affichent des quads et ils peuvent option- 
nellement etre precedes par 11, L ou q. Par exemple, %lld %16LX %qo. Si Perl connait les 
« longs doubles » (ceci requiert que la plate-forme supporte les longs doubles), les flags 
e f g E F G peuvent optionnellement etre precede par 11 ou L. Par exemple, %llf %Lf. 

La ou un nombre pourrait apparaitre dans les flags, un asterisque (« * ») peut etre uti- 
lise en lieu et place, auquel cas Perl utilise la prochaine entite dans la liste d'arguments 
comme le nombre donne (c'est-a-dire, comme le champ de largeur ou de precision). Si 
un champ de largeur, obtenu avec « * » est negatif, il entrame les memes effets qu'un 
flag « - » : une justification vers la gauche. 
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Le flag v est utilise pour afficher les valeurs ordinales de caracteres dans des chaines ar- 
bitraires : 

sprintf "la version est v%vd\n", $ A V; # version de Perl 

sprintf "l'adresse est %vd\n", $adr; # adresse IPv4 

sprintf "l'adresse est %*vX\n", $adr; # adresse IPv6 

sprintf "les bits sont %*vb\n", " ", $bits; # chaines de bits aleatoires 



sqrt 



sqrt 
sqrt 



EXPR 



Cette fonction renvoie la racine carree de EXPR. Pour les autre racines, comme la racine 
cubique, vous pouvez utiliser l'operateur ** pour elever quelque chose a une puissance 
fractionnaire. N'essayez par Fune de ces approches avec des nombres negatifs, car cela 
devient un probleme legerement plus complexe (et leve une exception). Mais il existe 
un module standard pour s'occuper de cela aussi : 

use Math: :Complex; 

print sqrt(-2); # affiche i.4142135623731i 



srand 

srand EXPR 
srand 

Cette fonction positionne la « graine » aleatoire pour l'operateur rand. Si EXPR est omi- 
se, elle utilise une valeur semi-aleatoire fournie par le noyau (si il supporte le periphe- 
rique /dev/urandom) ou basee sur l'heure et la date courante et le PID, entre autres 
choses. II n'est generalement pas du tout necessaire d'appeler srand, car si on ne l'appel- 
le pas explicitement, l'operateur rand l'invoque implicitement. Toutefois, ce n'etait pas 
vrai dans les version de Perl anterieures a 5.004, done si votre script a besoin de tourner 
avec des versions de Perl plus anciennes, il doit appeler srand. 

Les programmes appeles frequemment (comme les scripts CGI) qui n'utilisent que time 
A $$ pour generer une graine aleatoire peuvent les deux tiers du temps etre victimes de 
la propriete mathematique a A b == (a+l) A (b+l). Alors ne faites pas cela. A la place, uti- 
lisez : 

srand( time() A ($$ + ($$ « 15)) ); 

Vous aurez besoin de plus d'une graine plus aleatoire que celle par defaut pour faire de 
la cryptographic Sur certains systemes le peripherique /dev/urandom est approprie. Si- 
non, la methode habituelle est de faire une somme de controle (N.d.T. : checksum) sur la 
sortie compressee d'un ou plusieurs programmes donnant l'etat du systeme d'exploita- 
tion en tenant compte du changement rapide de ces etats. Par exemple : 

srand (time A $$ A unpack "%L*", 'ps wwaxl | gzip'); 

Si vous etes particulierement concernes par ce probleme, regardez le module 
Math: :TrulyRandom dans CPAN. 

N'appelez pas srand plusieurs fois dans un programme a moins de savoir exactement ce 
que vous faites et pourquoi vous le faites. Le but de cette fonction est d'initialiser une 
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« graine » pour la fonction rand pour qu'elle puisse produire un resultat different a cha- 
que lancement du programme. Ne l'appelez qu'une seule fois au debut, faute de quoi 
rand ne generera pas de nombres aleatoires ! 

stat Bi@ 

Stat HANDLE_FICHIER 

stat EXPR 

stat 

Dans un contexte scalaire, cette fonction renvoie un booleen indiquant si l'appel a reus- 
si. Dans un contexte de liste, elle renvoie une liste de 13 elements donnant Fetat d'un 
fichier, qu'il soit ouvert via HANDLE_FICHIER ou nomme par EXPR. Elle est generalement 
utilisee comme suit : 

($periph J $inode J $mode,$nb_liens,$uid,$gid J $type_periph,$taille, 
$date_a J $date_m J $date_c J $taille_bloc J $blocs) 
= stat $nom_fichier; 

Tous les champs ne sont pas supported par tous les systemes d'exploitation, les champs 
non-supportes renvoient 0. Voici les significations des champs : 



Tableau 29-5. Champs renvoyes par stat 



Index 


Champ 


Signification 


0 


$periph 


Numero de peripherique du systeme de fichier. 


1 


$inode 


Numero d'inode. 


2 


$mode 


Mode du fichier (type et permissions). 


3 


$nb liens 


Nombre de liens (en dur) vers le fichier. 


4 


$uid 


UID numerique du proprietaire du fichier. 


5 


$gid 


GID numerique du groupe designe du fichier. 


6 


$type periph 


Identificateur du peripherique (pour les fichiers speciaux 
seulement). 


7 


$taille 


Taille totale du fichier, en octets. 


8 


$date_a 


Derniere date d'acces au fichier en secondes depuis l'ori- 
gine. 


9 


$date_m 


Derniere date de modification du fichier en secondes 
depuis l'origine. 


10 


$date_c 


Date de changement de l'inode (et non de creation !) en 
secondes depuis l'origine. 


11 


$taille_bloc 


Taille de bloc prefere pour les entrees/sorties sur le systeme 
de fichier. 


12 


$blocs 


Nombre de blocs reellement alloues. 



$periph et $inode, pris ensemble, identifient un fichier de maniere unique. Les 
$taille_bloc et $blocs ne sont definis que sur les systemes de fichiers derives de BSD. 
Le champ $blocs (s'il est defini) est donne en blocs de 512 octets. La valeur de 
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$blocs*512 peut enormement differer de $taille pour des fichiers contenant des blocs 
non alloues, ou « trous », qui ne sont pas comptes dans $blocs. Si on passe a stat le 
handle de fichier special compose d'un souligne, aucune collection d'informations n'a 
lieu, mais le contenu actuel de la structure datant du dernier stat, lstat ou du dernier 
test de fichier en dependant (comme -r, -w ou -x) sont renvoyes. 

Comme le mode comprend a la fois le type du fichier et ses permissions, vous devez mas- 
quer la partie du type et faire printf ou sprintf avec "%o" si vous voulez voir les per- 
missions reelles : 

$mode = (stat($nom_fichier))[2]; 

printf "Les permissions sont %04o\n", $mode & 07777; 

Le module File : : stat fournit un mecanisme d'acces simplifie, oriente « par nom » : 

use File::stat; $sb = stat($nom_fichier); 

printf "Le fichier est %s, sa taille %s, ses permission %04o, date_m %s\n", 
$nom_fichierj $sb->size, $sb->mode & 07777 , 
scalar localtime $sb->mtime; 

Vous pouvez egalement importer les definitions symboliques des divers bits de mode 
depuis le module Fcntl. Voir la documentation en ligne pour plus de detail. 

Astuce : si vous n'avez seulement besoin que de la taille du fichier, essayez l'operateur 
de test de fichier - s, qui renvoie directement la taille en octets. II existe egalement des 
tests de fichiers qui renvoie Fage du fichier en nombre de jours. 



study SCALANE 
study 

Cette fonction prend du temps supplementaire pour etudier SCALAIRE afin d'anticiper 
de nombreuses recherches de motifs sur la chame avant qu'elle ne soit ensuite modifiee. 
Ceci peut ou non faire gagner du temps, selon la nature et le nombre de motifs de vos 
recherches, et selon la distribution des frequences de caracteres dans la chame 
recherchee — il vaut mieux que vous compariez les temps d'execution avec et sans stu- 
dy pour voir ce qui tourne le plus vite. Les boucles qui cherchent de nombreuses chaines 
courtes et constantes (y compris les parties constantes de motifs plus complexes) sont 
celles qui beneficieront le plus de study. Si tous vos motifs sont des chames constantes, 
ancrees au debut, study ne vous sera d'aucun secours car aucune scrutation ne sera ef- 
fectuee. Vous ne pouvez avoir qu'un seul study (N.d.T. : etude) actif a la fois ; si vous etu- 
diez un scalaire different, le premier est « de-etudie ». 

study fonctionne de la maniere suivante : une liste chamee de chacun des caracteres de 
la chame est construite de facon a savoir, par exemple, ou se trouvent tous les caracteres 
« k ». Pour chaque chaine, le caractere le plus rare est selectionne, en se fondant sur des 
tables de frequence statiques construites par des programmes C sur du texte anglais. 
Seuls les endroits contenant ce caractere rare sont examines. 

Par exemple, voici une boucle qui insere des entrees d'index avant toute ligne contenant 
un certain motif : 




while (<>) { 
study; 
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print ".IX machirAn" if AbmachiiAb/; 
print ".IX truc\n" if Abtruc\b/; 
print ".IX bidule\n" if Abbidule\b/; 

print; 

} 

Pendant cette recherche sur Abmachin\b/, seuls les endroits de $_ contenant « h » se- 
ront examinees car « h » est plus rare que les autres lettres. En general, le gain est indis- 
cutable, sauf dans des cas pathologiques. La seule question est de savoir si cela fait gagner 
plus de temps que de construire d'abord la liste chamee. 

Si vous devez rechercher des chaines que vous ne connaissez qu'au moment de l'execu- 
tion, vous pouvez construire un boucle complete sous forme de chaine et Pevaluer 
pour eviter la recompilation systematique de tous vos motifs. Ceci, associe a $/ pour en- 
trer des fichiers complets en un seul enregistrement, peut etre extremement rapide, sou- 
vent plus rapide que des programmes specialises comme fgrep(l). La routine suivante 
scrute une liste de fichiers (@f ichiers) pour trouver une liste de mots @mots), et affiche 
les noms des fichiers contenant une correspondance sans tenir compte de la casse : 

$recherche = 'while (<>) { study;'; 
foreach $mot (@mots) { 

$recherche .= "++\$vu{\$ARCV} if A\b$mot\\b/i;\n"; 

} 

$recherche .= "}"; 
(SARGV = |8fichiers; 

undef $/; # gobe chaque fichier en entier 

eval $recherche; # pied au plancher 

die $@ if $@ # en cas d'echec de eval 

$/ = "\n"; # remet le delimiteur d'entree normal 

foreach $fichier (sort keys(%vu)) { 
print $fichier, "\n"; 

} 

Maintenant que nous avons l'operateur qr//, les evals compliques a l'execution comme 
celui ci-dessus sont moins indispensables. Ceci fait la meme chose : 

@motifs = (); 

foreach $mot (gmots) { 

push @motifSj qr Ab$mot\b/i; 

} 

ISARGV = iSfichiers; 

undef $/; # gobe chaque fichier en entier 

while (<>) { 

for $motif (@motifs) { 

$vu{$ARGV}++ if /$motif/; 

} 

} 

$/ = "\n"; # remet le delimiteur d'entree normal 

foreach $fichier (sort keys(%vu)) { 
print $fichier, "\n"; 

} 



Fonctions Perl par ordre alphabetique 



761 



sub 

Declarations nominees : 

sub NOM PROTO ATTRS 
sub NOM ATTRS 
sub NOM PROTO 
sub NOM 

Definitions nommee : 

sub NOM PROTO ATTRS BLOC 
sub NOM ATTRS BLOC 
sub NOM PROTO BLOC 
sub NOM BLOC 

Definitions anonymes : 

sub PROTO ATTRS BLOC 
sub ATTRS BLOC 
sub PROTO BLOC 
sub BLOC 

La syntaxe des declarations et definitions de sous-programmes parait compliquee, mais 
elle est vraiment assez simple en pratique. Tout est base sur la syntaxe : 

sub NOM PROTO ATTRS BLOC 

Les quatre arguments sont tous optionnels ; la seule restriction est que les champs pre- 
sents doivent etre presents dans cet ordre ; et que vous devez utiliser au moins un des 
champs NOM ou BLOC. Pour le moment nous ignorerons les champs PROTO et ATTRS ; ce 
sont seulement des modificateurs de la syntaxe de base. Les champs NOM et BLOC sont les 
parties importantes pour faire court : 

• Si vous n'avez qu'un NOM mais pas de BLOC, il s'agit d'une declaration de ce nom (et 
si jamais vous voulez appelez le sous-programme, vous devrez fournir plus tard une 
definition avec a la fois NOM et BLOC). Les declarations nominees sont specialement 
utiles pour que Fanalyseur syntaxique traite un nom de maniere speciale s'il sait 
qu'il s'agit d'un sous-programme defini par Futilisateur. Vous pouvez appelez ceci 
un sous-programme ou une fonction ou encore un operateur, exactement comme 
les fonctions internes. Ces declarations sont parfois appelees declarations anticipees. 

• Si vous avez a la fois un NOM et un BLOC, il s'agit d'une definition standard d'un sous- 
programme nomme (et egalement une declaration, si vous n'avez pas declare le 
nom precedemment). Les definitions nominees sont specialement utiles car le BLOC 
associe un veritable sens (le corps du sous-programme) a la declaration. C'est exac- 
tement ce que cela signifie lorsque nous disons qu'elle definit le sous-programme 
au lieu de simplement le declarer. La definition ressemble toutefois a la declara- 
tion, en ce que le code l'encadrant ne la voit pas, et qu'elle ne renvoie pas de valeur 
en ligne avec laquelle vous pourriez referencer le sous-programme. 

• Si vous n'avez qu'un BLOC mais pas de NOM, il s'agit d'une definition sans nom, c'est- 
a-dire, un sous-programme anonyme. Puisqu'elle n'a pas de nom, ce n'est absolu- 
ment pas une declaration, mais un operateur reel qui renvoie a l'execution une 
reference vers le corps du sous-programme anonyme. C'est extremement utile pour 
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traiter du code en tant que donnee. Cela vous permet de passer de menus morceaux 
de code en tant que fonctions de rappel (N.d.T. : callbacks), ou peut-etre meme en 
tant que fermetures si l'operateur de definition sub se refere a des variables lexicales 
qui se trouvent a l'exterieur de son propre code. Cela signifie que differents appels 
au meme operateur sub feront la comptabilite necessaire pour conserver la visibi- 
lity de la « version » correcte de chacune de ces variables lexicales le temps ou la 
fermeture existe, meme si la portee d'origine des variables lexicales a ete detruite. 

Dans chacun de ces trois cas, soit Fun, soit les deux arguments PROTO etATTRS peuvent 
apparaitre apres le NOM et avant le BLOC. Un prototype est une liste de caracteres entre 
parentheses qui indique a Fanalyseur syntaxique comment traiter les arguments d'une 
fonction. Les attributs sont introduits par un deux-points et fournissent des informa- 
tions supplementaires a l'analyseur concernant la fonction. Voici une definition typi- 
que qui inclut tous les quatre champs : 

num_ch_cmp ($$) : locked { 
my ($a, $b) = @_; 
return $a <=> $b | | $a cmp $b; 

} 

pour plus de details sur les listes d'attributs et leur manipulation, voir le pragma attri- 
butes au chapitre 31. Voir egalement le chapitre 6 et la section Sous-programmes anony- 
mes au chapitre 8. 

substr H @ @ 

subtsr EXPR, DECALAGE, LONGUEUR, REMPLACEMENT 
subtsr EXPR, DECALAGE, LONGUEUR 
subtsr EXPR, DECALAGE 

Cette fonction extrait une sous-chaine de la chaine donnee par EXPR et la renvoie. La 
sous-chaine est extraite en commencant a DECALAGE caracteres depuis le premier. (Re- 
marque : si vous avez fait le malin avec $[, le debut de la chaine n'est pas a 0, mais com- 
me vous avez ete sage (n'est-ce pas ?) il n'y a pas de probleme). Si DECALAGE est negatif, 
la sous-chaine demarre a cette distance de la fin de la chaine. Si LONGUEUR est omise, tou- 
te la fin de la chaine est renvoyee. Si LONGUEUR est negative, la longueur est calculee pour 
laisser ce nombre de caracteres depuis la fin de la chaine. Sinon, LONGUEUR indique la 
longueur de la sous-chaine a extraire, ce a quoi vous pouviez vous attendre. 

Vous pouvez utiliser substr comme une lvalue (quelque chose a laquelle on peut assi- 
gner une valeur), auquel cas EXPR doit aussi en etre une. Si Ton assigne une valeur d'une 
longueur inferieure a LONGUEUR, la chaine sera raccourcie et si Ton assigne une valeur 
d'une longueur superieure a LONGUEUR, la chaine s'allongera pour s'en accommoder. II 
vous faudra peut-etre completer ou couper la valeur avec sprintf ou l'operateur x pour 
conserver une chaine de meme longueur. Si vous tentez une affectation dans une zone 
non-allouee apres la fin la chaine, substr leve une exception. 

Pour prefixer la valeur courante de $var par la chaine "Achille" , ecrivez : 

substr($var, 0, 0) = "Achille"; 
Pour remplacer le premier caractere de $var par "Talon" , ecrivez : 

substr($var, 0, l) = "Talon"; 
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Et enfin, pour remplacer le dernier caractere de $var par "Lefuneste" , ecrivez : 

substr($var, -1, l) = "Lefuneste"; 

Une alternative a Futilisation de substr en tant que lvalue est l'emploi de la chaine /{EM- 
PLACEMENT comme quatrieme argument. Ceci vous permet de remplacer des partie de 
YEXPR et de renvoyer ce qu'il y avait avant en une seule operation, exactement comme 
vous pouvez le faire avec splice. Le prochain exemple remplace egalement le dernier 
caractere de $var par "Lefuneste" et met la chaine remplacee dans $avant : 

$avant = substr($var, -1, 1, "Lefuneste"); 

substr en tant que lvalue n'est pas reservee seulement aux affectations. Cet exemple 
remplace les espaces par des points, mais seulement dans les 10 derniers caracteres de la 
chaine : 

substr($var, -10) =~ s/ /./g; 



symlink ANCIEN_N0M, N0UVEAU_N0M 

Cette fonction cree un nouveau nom de fichier lie symboliquement a l'ancien nom de 
fichier. La fonction renvoie vrai en cas de succes, sinon faux. Sur les systemes ne suppor- 
tant pas les liens symboliques, elle leve une exception a l'execution. Pour eviter cela, uti- 
lisez eval pour intercepter l'erreur potentielle : 

$symlink_existe = eval { symlink("", ""); 1 }; 

Ou utilisez le module Conf ig. Soyez prudent si vous fournissez un lien symbolique re- 
latif, car cela sera interprets relativement a la position du lien symbolique lui-meme, et 
non a votre repertoire de travail courant. 

Voir egalement link et readlink plus haut dans ce chapitre. 



syscall LISTE 

Cette fonction invoque l'appel systeme (nous voulons dire un appel systeme, et pas une 
commande shell) specifie dans le premier argument de la liste en passant les elements 
restants comme arguments a l'appel systeme. (Beaucoup d'entre eux sont maintenant 
plus directement disponibles par le biais de modules comme POSIX). La fonction leve 
une exception si syscall(2) n'est pas implemente. 

Les arguments sont interpretes comme suit : si un argument donne est numerique, l'ar- 
gument est passe comme un entier C. Sinon, c'est un pointeur sur la valeur chaine qui 
est passe. Vous devez vous assurer que la chaine est assez longue pour recevoir tout re- 
sultat pouvant y etre ecrit ; sinon vous chercher la copie du cceur du programme (core 
dump). Vous ne pouvez pas utiliser une chaine litterale (ou toute autre chaine en lecture 
seule) comme argument de syscall car Perl doit prevoir que Ton puisse ecrire dans tout 
pointeur de chaine. Si vos arguments entiers ne sont pas des litteraux et n'ont jamais ete 
interpretes dans un contexte numerique, vous devrez peut-etre leur ajouter 0 pour les 
forcer a ressembler a des nombres. 

syscall renvoie toute valeur retournee par l'appel systeme invoque. D'apres les con- 
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ventions de codage C, si l'appel systeme echoue, syscall renvoie -1 et positionne $! 
(errno). Certains appels systeme renvoient legitimement -1 en cas de reussite. La ma- 
niere appropriee de gerer de tels appels systeme et d'assigner $ ! =0; avant l'appel et de 
verifier la valeur de $ ! si syscall renvoie -1. 

Tous les appels systeme ne sont pas accessibles de cette maniere. Par exemple, Perl peut 
passer jusqu'a 14 arguments a votre appel systeme, ce qui doit normalement suffire en 
pratique. II existe cependant un probleme avec les appels systeme qui renvoient des va- 
leurs multiples. Prenez syscall(&SYS_pipe) : il renvoie le numero de fichier de l'extre- 
mite de lecture du pipe qu'il cree. Il n'y a aucun de moyen de recuperer le numero de 
fichier de l'autre extremite. Vous pouvez eviter ce type de probleme en utilisant pipe a 
la place. Pour resoudre le probleme generique, ecrivez des XSUB (modules de sous-pro- 
grammes externes, un dialecte de C) pour acceder aux appels systeme directement. Puis 
mettez votre nouveau module sur CPAN et devenez mondialement populaire. 

Le sous-programme suivant renvoie l'heure courante en tant que nombre a virgule f lot- 
tante plutot que le nombre entier de secondes renvoye par time. (II ne fonctionne que 
sur les machines qui supporte l'appel systeme gettimeofday (2).) 

sub heurepreciseQ { 

package main; # pour le prochain require 
require ' syscall. ph' ; 

# prepare le tampon pour qu'il soit de la taille de deux entiers 

# longs de 32-bits 

my $tv = pack("LL", ()); 
syscall(&SYS_gettimeofday, $tv, undef) >=0 

or die "gettimeofday : $!"; 
my ($secondes, $microsecondes) = unpack("LL", $tv); 
return $secondes + ($microsecondes /l_000_000); 

} 

Imaginez que Perl ne supporte pas l'appel systeme setgroups(2) 18 , mais que votre noyau 
l'implemente. Vous pourriez toujours l'atteindre de cette maniere : 

require ' syscall. pb' ; 

syscall(&SYS_setgroups; scalar (Snouveaux gids, pack("i*", (Snouveaux gids)) 
or die "setgroups : $! "; 

Vous devrez peut-etre lancer h2ph, comme l'indiquent les instructions d'installations de 
Perl, pour creer syscall.ph. Certains systemes peuvent necessiter a la place un canevas 
pour pack de "II". Encore plus perturbant, la fonction syscall suppose une equivalen- 
ce de taille entre les types C int, long et char*. Essayez de ne pas considerer syscall 
comme le parangon de la portabilite. 

Voir le module Time: :HiRes de CPAN pour une approche plus rigoureuse des proble- 
mes de dates et d'heures d'une granularite plus fine. 



sysopen 

sysopen HANDL E FICHIER, NOM_FICHIER, MODE, MASQUE 
sysopen HANDL E FICHIER, NOMJICHIER, MODE 



18. Bien qu'il le supporte via $(. 
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La fonction sysopen ouvre le fichier dont le nom est donne par NOM_FICHIER et l'associe 
avec HANDLE_FICHIER. Si HANDLE_FICHIER est une expression, sa valeur est employee 
comme le nom du handle de fichier ou comme une reference sur ce dernier. Si 
HANDLE_FICHIER est une variable dont la valeur est indefinie, une valeur sera creee pour 
vous. La valeur de retour est vrai si l'appel reussit, sinon faux. 

Cette fonction est une interface directe a l'appel open(2) de votre systeme d'exploitation 
suivi par un appel de bibliotheque fdopen(3). En tant que tel, vous devrez ici pretendre 
etre un peu un programmeur C. Les valeurs possibles et les flags de bits du parametre 
MODE sont disponibles via le module Fcntl. Puisque des systemes differents supportent 
des flags differents, ne comptez pas sur la disponibilite de tous les flags sur votre syste- 
me. Consultez votre page de manuel open{2) ou son equivalent local pour plus de de- 
tails. Neanmoins, les flags suivants devrait etre presents sur tout systeme disposant 
d'une bibliotheque C raisonnable : 



Flag 


Signification 


0_RD0NLY 


Lecture seule. 


0_WR0NLY 


Ecriture seule. 


0_RDWR 


Lecture et ecriture. 


0_CREAT 


Cree le fichier s'il n'existe pas. 


0_EXCL 


Echoue si le fichier existe deja. 


OAPPEND 


Ajoute a la fin du fichier. 


0_TRUNC 


Tronque le fichier. 


0_N0NBL0CK 


Acces non-bloquant. 



Beaucoup d'autres options sont toutefois possibles. Voici quelques flags moins com- 
muns : 



Flag 


Signification 


0 


NDELAY 


Ancien synonyme pour 0 NONBLOCK 


0_ 


SYNC 


Ecrit un bloc jusqu'a ce que la donnee soit physiquement ecrite vers le 
materiel sous-jacent. On peut egalement voir ici 0 ASYNC, 0 DSYNC et 
0_RSYNC. 


0_ 


EXLOCK 


flock avec LOCK EX (a titre consultatif seulement). 


0_ 


SHLOCK 


flock avec L0CK_SH (a titre consultatif seulement). 


0_ 


DIRECTORY 


Echoue si le fichier n'est pas un repertoire. 


0_ 


N0F0LL0W 


Echoue si le dernier composant du chemin est un lien symbolique. 


0_ 


BINARY 


Effectue un binmode pour les systemes Microsoft. Un 0 TEXT peut ega- 
lement parfois exister pour obtenir le comportement oppose. 


0_ 


LARGEFILE 


Certains systemes en ont besoin pour les fichiers de plus de 2 GO. 


0_ 


NOCTTY 


Louverture d'un fichier de terminal ne le fera pas devenir le terminal 
de controle du processus si vous n'en aviez pas encore. Habituellement 
ce flag n'est plus necessaire. 
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Le flag 0_EXCL ne sert pas pour les verrous : ici, l'exclusivite signifie que si le fichier exis- 
te deja, sysopen echoue. Si le fichier nomme par NOM_FICHIER n'existe pas et que le MODE 
inclue le flag 0_CREAT, alors sysopen cree le fichier avec les permissions initiales deter- 
minees par 1'argument MASQUE (ou 0666 s'il est omis) et modifie par le umask courant de 
votre processus. Cette valeur par defaut est raisonnable : voir la definition de umask pour 
une explication. 

Les handles de fichiers ouverts avec open et sysopen peuvent etre utilises de maniere in- 
terchangeable. Vous n'avez pas besoin d'utiliser sysread et ses amis simplement parce 
que vous avez ouvert le fichier avec sysopen, et rien ne vous en empeche si vous l'avez 
ouvert avec open. Les deux sont capables de choses que l'autre ne peut pas faire. Un open 
traditionnel peut ouvrir des pipes, forker des processus, positionner des disciplines, du- 
pliquer des handles de fichiers et convertir un numero descripteur de fichier vers un 
handle de fichier. De plus, il ignore les caracteres d'espacement au debut ou a la fin du 
nom de fichier et respecte la particularity de « - » en tant que nom de fichier special. 
Mais lorsqu'il s'agit d'ouvrir de veritables fichiers, sysopen peut faire tout ce qu'open 
fait. 

Les exemples suivants montrent les appels equivalents a ces deux fonctions. Nous avons 
omis les verifications or die $! pour plus de clarte, mais assurez-vous de toujours ve- 
rifier les valeurs de retour dans vos programmes. Nous nous restreindrons a n'employer 
que les flags disponibles sur virtuellement tous les systemes d'exploitations. II s'agit sim- 
plement d'un moyen de controler les valeurs que vous rassemblez par un OU en utili- 
sant l'operateur de bit | pour les passer dans 1'argument MODE . 

• Ouvrir un fichier en lecture : 

open(HF, "<", $chemin); 
sysopen(HF, $chemin, 0_RD0NLY); 

• Ouvrir un fichier en ecriture, en cream un nouveau fichier si besoin ou en tron- 
quant un fichier existant : 

open(HF, ">", $chemin); 

sysopen(HF, $chemin, OWRONLY | 0_TRUNC | OCREAT); 

• Ouvrir un fichier en ajout, en le creant si besoin : 

open(HFj ">>", $chemin); 

sysopen(HF, $chemin, OWRONLY | 0_APPEND | OCREAT); 

• Ouvrir un fichier en mise a jour, le fichier devant deja exister : 

open(HFj "+<", $chemin); 
sysopen(HF J Schemin, 0_RDWR); 

Et voici ce que vous pouvez faire avec sysopen mais pas avec un open traditionnel : 

• Ouvrir et creer un fichier en ecriture, le fichier ne devant pas deja exister : 

sysopen (HF, $chemin, OWRONLY | 0_EXCL | 0_CREAT); 

• Ouvrir un fichier en ajout, le fichier devant deja exister : 

sysopen (HF, $chemin, OWRONLY | 0_APPEND); 

• Ouvrir un fichier en mise a jour, en creant un nouveau fichier si besoin : 

sysopen(HF, Schemin, 0_RDWR | OCREAT); 
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• Ouvrir un fichier en mise a jour, le fichier ne devant pas deja exister : 

sysopen(HF, $chemin, 0_RDWR | 0_EXCL | OCREAT); 

• Ouvrir un fichier en ecriture seule sans bloquer, mais sans creer le fichier s'il 
n'existe pas : 

sysopen(HF, $chemin, OWRONLY | 0JI0NBL0CK); 

Le module FileHandle, decrit au chapitre 32, offre un ensemble de synonymes orientes 
objet (plus quelques nouvelles fonctionnalites) pour ouvrir des fichiers. Vous etes cor- 
dialement invites a utiliser les methodes appropriees de FileHandle 19 sur tout handle 
cree avec open, sysopen, pipe, socket ou accept, meme si vous n'avez pas employe le 
module pour initialiser ces handles. 

sysread 

sysread HANDL EFICHIER, SCALAIRE, LONGUEUR, DEC AL AGE 
sysread HANDL EFICHIER, SCALAIRE, LONGUEUR 

Cette fonction tente de lire LONGUEUR octets de donnees dans la variable SCALAIRE depuis 
le HANDLE_FICHIER specifie en utilisant l'appel systeme de bas niveau read(2). La fonc- 
tion renvoie le nombre d'octets reellement lus, ou 0 en fin de fichier. Elle renvoie undef 
en cas d'erreur. La taille de SCALAIRE sera ajustee a la longueur effectivement lue. Le DE- 
CALAGE, s'il est specifie, indique a partir d'oii lire dans la chaine, afin de pouvoir lire au 
milieu d'une chaine utilisee comme tampon. Voir syswrite pour un exemple d'utilisa- 
tion de DECALAGE. Une exception est levee si LONGUEUR est negative ou si DECALAGE pointe 
a l'exterieur de la chame. 

Preparez-vous a gerer vous-meme les problemes (comme les appels systeme interrom- 
pus) que les entrees/sorties standards gerent habituellement pour vous. Comme 
sysread passe outre les entrees/sorties standards, ne melangez pas sysread avec d'autres 
type de lectures, ni avec print, printf, write, seek, tell ou eof a moins d'etre adepte 
des sciences occultes (ou des soirees cuir et chaihes). De meme, soyez s'il vous plait pre- 
venus que lors de la lecture dans un fichier contenant de l'Unicode ou tout autre enco- 
dage sur plusieurs octets, les frontieres du tampon peuvent tomber au milieu d'un 
caractere. 



sysseek go @ 

sysseek HANDL EFICHIER, POSITION, DEPART 

Cette fonction affecte la position systeme du HANDLE_FICHIER en utilisant l'appel syste- 
me lseek(2). Elle passe outre les entrees/sorties standard, ainsi les melanges avec des lec- 
tures (autres que par sysread), ou avec print, printf, write, seek, tell ou eof peuvent 
semer la confusion. HANDLE_FICHIER peut etre une expression dont la valeur donne le 
nom du handle de fichier. Les valeurs de DEPART sont 0 pour mettre se positionner exac- 
tement a POSITION, 1 pour se positionner a la position courante plus POSITION et 2 pour 
se positionner a EOF plus POSITION (en general, negative). Pour DEPART, vous pouvez 
utiliser les constantes SEEK_SET, SEEK_CUR et SEEK_END des modules standards 10: : See- 



19. En fait, les methodes de 10: :File ou 10: : Handle. 
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kable et POSIX — ou, depuis la version 5.6 de Perl, du module Fcntl qui est plus porta- 
ble et plus pratique. 

La fonction renvoie la nouvelle position ou undef en cas d'echec. Une position de zero 
est renvoyee comme etant la chaine speciale « 0 but true » (N.d.T. : 0 mais vrai), qui 
peut etre utilise numeriquement sans produire d'avertissements. 

system asm 

system CHEMIN LISTE 
system CHEMIN 

Cette fonction execute pour vous tout programme existant sur le systeme et renvoie le 
code de retour de ce programme — et non sa sortie. Pour capturer la sortie d'une com- 
mande, utilisez les apostrophes inverses ou qx// a la place. La fonction system fonction- 
ne exactement comme exec, hormis le fait qu'elle effectue d'abord un fork puis, 
qu'apres l'exec, elle attende que le programme execute se termine. C'est-a-dire qu'elle 
lance le programme et revient quand ce dernier a fini, au contraire d'exec, qui remplace 
le programme en train de tourner par le nouveau et qui done ne revient jamais si le rem- 
placement reussit. 

Le traitement des parametres varie selon le nombre d'arguments, comme dans la des- 
cription d'exec, y compris le fait de determiner si le shell sera appele et si vous avez men- 
ti au programme a propos de son nom en specifiant un CHEMIN separe. 

Etant donne que system et les apostrophes inverses bloquent les signaux SIGINT et SI- 
GOUIT, l'envoi de Fun de ces signaux (provenant par exemple d'un Control-C) au pro- 
gramme en train de tourner n'interrompt pas votre programme principal. Mais l'autre 
programme qui est en train de tourner recoit bien le signal. Verifiez la valeur de retour 
de system pour voir si le programme que vous avez lance s'est termine proprement ou 
pas. 

@args = ("commande", "argl", "arg2"); 
system(@args) == 0 

or die "system @args a echoue : $?"; 

La valeur de retour est le statut de sortie du programme tel que renvoye par l'appel sys- 
teme wait{2). Avec les semantiques traditionnelles, pour obtenir la veritable valeur de 
sortie, divisez par 256 ou faites un decalage de 8 bits vers la gauche. Ceci car Foctet de 
poids faible contient quelque chose d'autre. (Deux choses en fait.) Les sept bits de poids 
faible indiquent le numero du signal qui a tue le processus (s'il y en a un) et le huitieme 
bit indique si le processus a fait une copie du cceur du programme (core dump). Vous 
pouvez verifier toutes les possibilites d'echec, y compris les signaux et les core dumps, en 
inspectant $? ($CHILD_ERROR) : 

$valeur_sortie = $? >> 8; 

$num_signal = $? & 127; # ou 0x7f, ou 0177, ou ObOlllllll 
$coeur_copie = $? & 128; # ou 0x80, ou 0200, ou OblOOOOOOO 

Lorsque le programme a ete lance a travers un shell 20 car vous aviez un seul argument 



20. C'est-a-dire /bin/sh par definition, ou tout ce qui a un sens sur votre plate-forme, mais pas le 
shell que l'utilisateur utilise a ce moment. 
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et que cet argument contenait des metacaracteres du shell, les codes de retours normaux 
sont sujets aux caprices et aptitudes supplementaires du shell. En d'autres termes, dans 
ces circonstances, vous pouvez etre incapable de retrouver 1'information detaillee decri- 
te precedemment. 



syswrite u @ @ 

syswrite HANDL E_ FICHIER, SCALAIRE, LONGUEUR, DECALACE 
syswrite HANDL E_ FICHIER, SCALAIRE, LONGUEUR 
syswrite HANDLEFICHIER, SCALAIRE 

Cette fonction tente d'ecrire LONGUEUR octets de donnees depuis la variable SCALAIRE 
vers le HANDLE_FICHIER specifie en utilisant l'appel systeme write(2). La fonction renvoie 
le nombre d'octets reellement ecrits, ou undef en cas d'erreur. Le DECALAGE, s'il est spe- 
cific, indique a partir de quel endroit de la chaine il faut commencer a ecrire. (Si par 
exemple la chaine vous sert par exemple de tampon, ou qu'il vous faut reprendre une 
ecriture partielle.) Un DECALAGE negatif specifie que l'ecriture doit partir de ce nombre 
d'octets depuis la fin de la chaine. Si SCALAIRE est vide, le seul DECALAGE permis est 0. 
Une exception est levee si LONGUEUR est negative ou si DECALAGE pointe a l'exterieur de 
la chame. 

Pour copier des donnees du handle de fichier DEPUIS vers le handle de fichier VERS, vous 
pouvez utiliser quelque chose comme : 

use Errno qw/EINTR/; 

$taille_bloc = (stat FROM) [11 ] || 16384; # taille de bloc preferee ? 
while ($lng = sysread DEPUIS, $tamp, $taille_bloc) { 
if (! defined $lng) { 

next if $! == EINTR; 

die "Erreur systeme sur read : $!\n"; 

} 

$decalage = 0; 

while ($lng) { # Gere les ecritures partielles. 
$ecrit = syswrite VERS, $tamp, $lng, $decalage; 
die "Erreur systeme sur write : $!\n" unless defined $ecrit; 
$decalage += $ecrit; 
$lng -= $ecrit; 

} 

} 

Preparez-vous a gerer par vous-meme les problemes que les entrees/sorties standards 
traitent habituellement pour vous, telles que les ecritures partielles. Comme syswrite 
passe outre les entrees/sorties standards de la bibliotheque C, ne melangez pas d'appels 
a syswrite avec des lectures (autres que sysread), des ecritures (comme print, printf 
ou write) ou d'autres operations d'entrees/sorties comme seek, tell ou eof a moins 
d'etre adepte des sciences occultes. 21 



21. Ou des soirees cuir et chaines. 
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tell @ 

tell HANDL E_ FICHIE R 
tell 

Cette fonction renvoie la position actuelle dans le fichier (en octets, sur une base de ze- 
ro) pour HANDLE_FICHIER. Generalement, cette valeur est passee a la fonction seek a un 
moment ulterieur pour revenir a la position courante. HANDLE_FICHIER peut etre une 
expression donnant le nom du handle de fichier reel ou une reference sur un objet han- 
dle de fichier. Si HANDLE_FICHIER est omis, la fonction renvoie la position dans le der- 
nier fichier lu. Les positions ne sont significatives que sur les fichiers ordinaires. Les 
peripheriques, les pipes et les sockets ne connaissent pas les positions. 

II n'existe pas de fonction systell. Utilisez sysseek(HF, 0, l) pour cela. Voir seek 
pour un exemple expliquant comment utiliser tell. 



telldir @ no 

telldir HANDL EREPERTOIRE 

Cette fonction renvoie la position courante des routines readdir sur 
HANDLE_REPERTOIRE. Cette valeur peut etre fournie a seekdir pour acceder a un endroit 
particulier d'un repertoire. La fonction comporte les memes dangers relatifs a un pos- 
sible compactage du repertoire que la routine de la bibliotheque systeme correspondan- 
te. Cette fonction peut ne pas etre implemented partout ou Test readdir. Meme si c'est 
le cas, aucun calcul ne peut etre fait avec la valeur de retour. II s'agit seulement d'une 
valeur opaque, qui n'a de signification que pour seekdir. 



tie H 

tie VARIABLE, NOM CLASSE, LISTE 

Cette fonction relie une variable a une classe de paquetage qui fournit l'implementation 
de la variable. VARIABLE est la variable (scalaire, tableau ou hachage) ou le type glob (re- 
presentant un handle de fichier) qui doit etre relie. N0M_CLASSE est le nom d'une classe 
implementant des objets du type approprie. 

Tous les arguments additionnels sont passes a la methode constructeur approprie, soit 
Fun des constructeurs parmi TIESCALAR, TIEARRAY ou TIEHASH. (Si la methode appro- 
priee n'est pas trouvee, une exception est levee.) Ces arguments sont generalement simi- 
laires a ceux que Ton enverrait a la fonction dbm_open(3) du C, mais leur signification 
depend du paquetage. L'objet renvoye par le constructeur est a son tour renvoye par la 
fonction tie, ce qui s'avere utile si vous voulez acceder a d'autres methodes de 
N0M_CLASSE. (On peut aussi acceder a l'objet par le biais de la fonction tied). Ainsi, une 
classe reliant un hachage a une implementation ISAM peut fournir une methode sup- 
plemental pour traverser sequentiellement un ensemble de clefs (le « S » de ISAM), 
puisque vos implementations habituelles de DBM ne peuvent pas le faire. 

Les fonctions comme keys et values peuvent renvoyer d'enormes valeurs de listes 
quand elles sont appliquees a de grands objets comme des fichiers DBM. Vous pouvez 
preferer utiliser la fonction each pour parcourir ces derniers. Par exemple : 
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use NDBM_File; 

tie %ALIAS, "NDBM_File", "/etc/aliases", 1, 0 

or die "Impossible d'ouvrir les alias : $!\n"j 
while (($clef,$val) = each %ALIAS) { 

print $clef, ' = ', $val, "\n"; 

} 

untie %ALIAS; 

Une classe implementant un hachage doit comprendre les methodes suivantes : 

TIEHASH CLASSE, LISTE 
FETCH SOI, CLEF 
STORE SOI, CLEF , VALEUR 
DELETE SOI, CLEF 
CLEAR SOI 
EXISTS SOI, CLEF 
FIRSTKEY SOI 

NEXTKEY SOI, CLEF_ PRECEDENTE 
DESTROY SOI 

Une classe implementant un tableau ordinaire doit comprendre les methodes 
suivantes : 

TIEARRAY CLASSE, LISTE 

FETCH SOI, INDICE 

STORE SOI, INDICE, VALEUR 

FETCHSIZE SOI 

STORESIZE SOI, COMPTEUR 

CLEAR SOI 

PUSH SOI, LISTE 

POP SOI 

SHIFT SOI 

UNSHIFT SOI LISTE 

SPLICE SOI, DECALAGE, LONGUEUR, LISTE 
EXTEND SOI, COMPTEUR 
DESTROY SOI 

Une classe implementant un scalaire doit comprendre les methodes suivantes : 

TIESCALAR CLASSE, LISTE 
FETCH SOI 
STORE SOI, VALEUR 
DESTROY SOI 

Une classe implementant un handle de fichier doit comprendre les methodes 
suivantes : 

TIEHANDLE CLASSE, LISTE 

READ SOI, SCALAIRE, LONGUEUR, DECALAGE 

READLINE SOI 

GETC SOI 

WRITE SOI, SCALAIRE, LONGUEUR, DECALAGE 

PRINT SOI, LISTE 

PRINTF SOI, FORMAT, LISTE 

CLOSE SOI 

DESTROY SOI 
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Les methodes indiquees ci-dessus n'ont pas toutes besoin d'etre implementees: Les mo- 
dules Tie: : Hash, Tie: : Array, Tie: : Scalar et Tie: :Handlefournissentdes classes de ba- 
ses qui ont des methodes par defaut raisonnables. Voir chapitre 14, Variables attachees, 
pour un commentaire detaille de ces methodes. A l'inverse de dbmopen, la fonction tie 
ne fera pas automatiquement un use ou un require — vous devez le faire vous-meme 
explicitement. Voir les modules DB_File et Conf ig qui fournissent des implementations 
interessantes de tie. 

tied 

tied VARIABLE 

Cette fonction renvoie une reference vers l'objet qui sous-tend le scalaire, le tableau, le 
hachage ou le typeglob contenu dans VARIABLE (la meme valeur qui a ete renvoyee a 
l'origine par l'appel a tie, qui a lie la variable au paquetage). Elle renvoie la valeur in- 
definie si VARIABLE n'est pas attachee a un paquetage. Vous pouvez par exemple utiliser : 

ref tied %hachage 

pour savoir a quel paquetage votre hachage est attache. (A supposer que vous l'ayez 
oublie). 

time 

time 

Cette fonction renvoie le nombre de secondes ecoulees depuis le l er janvier 1970, UTC, 
a 00::00::00. 22 La valeur renvoyee est acceptee par gmtime et localtime pour servir aux 
comparaisons avec les dates de modification et d'acces renvoyees par stat et pour etre 
passee a utime. 

$debut = timeQ; system("une commande lente"); 

$fin = time(); 

if ($fin - $debut > l) { 

print "Le programme a commence a : ", scalar localtime($debut), "\n"; 

print "Le programme a fini a : ", scalar localtime($fin), "\n"; 

} 

times m 

times 

Dans un contexte de liste, cette fonction renvoie un tableau a quatre elements donnant 
les temps utilisateur et systeme, en secondes (probablement fractionnaires), pour ce 
processus et pour les fils de ce processus qui sont termines. 

($utilisateur, $systeme, $cutilisateur, $csysteme) = times(); 
printf "Ce pid et ses fils ont consomme %.3f secondes\n", 

$utilisateur + $systeme + $cutilisateur + $csysteme; 



22. Que l'on appelle aussi « epoch », origine — a ne pas confondre avec l'« epopee », qui se rap- 
porte a la conception d'UNIX. (D'autres systemes d'exploitation ont une origine differente, pour 
ne pas parler de leur epopee.) 
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Dans un contexte scalaire, elle ne renvoie que le temps utilisateur. Par exemple, pour 
mesurer la vitesse d'execution d'une section de code Perl : 

$debut = times(); 
$fin = times(); 

printf "Nous avons mis %.2f secondes CPU en temps utilisateur\n", 
$fin - $debut; 



tr/// m 

Xxlll 
y/// 

II s'agit de l'operateur de traduction (appele aussi translation), qui ressemble a l'opera- 
teur y/// du programme sed d'UNIX, en mieux, selon l'humble opinion de tout le 
monde. Voir le chapitre 5. 

truncate ® @ \B B 

truncate HANDL E_ FICHIER, LONGUEUR 
truncate EXPR, LONGUEUR 

Cette fonction tronque le fichier ouvert sur HANDLE_FICHIER, ou nomme par EXPR, a la 
longueur specifiee. La fonction leve une exception si truncate(2) ou un equivalent n'est 
pas implemente sur le systeme. (II est toujours possible de tronquer un fichier en n'en 
recopiant que le debut, si vous disposez de l'espace disque necessaire.) La fonction ren- 
voie vrai en cas de succes, undef sinon. 



uc H □ 

uc EXPR 
uc 

Cette fonction renvoie une version en majuscules de EXPR. II s'agit de la fonction interne 
implementant l'echappement \U dans les chaines entre guillemets. Perl essayera de faire 
de qu'il faut pour respecter les valeurs actuelles de votre locale, mais nous travaillons 
toujours sur les interactions avec Unicode. Voir la page de manuel perllocale pour les 
dernieres avancees. Dans tous les cas, lorsque Perl utilise les tables Unicode, uc convertit 
en majuscules plutot qu'en capitales de titres. Voir ucf irst pour les conversions en ca- 
pitales de titres. 



ucfirst E 0 

ucfirst EXPR 
ucfirst 

Cette fonction renvoie une version de EXPR avec la premiere lettre en majuscule (title- 
cased, mise en capitale de titre dans le jargon Unicode). II s'agit de la fonction interne 
implementant l'echappement \u dans les chaines entre guillemets. Votre locale 
LC_CTYPE actuelle peut etre respectee si vous faites un use locale et si vos donnees ne 
ressemblent pas a de l'Unicode, mais nous ne garantissons rien pour le moment. 
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Pour forcer la premiere lettre en capitale et tout le reste en minuscules, utilisez : 

ucfirst lc $mot 
ce qui est equivalent a "\u\L$mot". 



umask EXPR 
umask 

Cette fonction fixe le umask (masque utilisateur) du processus et renvoie l'ancien en uti- 
lisant l'appel systeme umask(2). Votre umask indique au systeme d'exploitation quels bits 
de permissions desactiver au moment de creer un nouveau fichier, y compris les fichiers 
qui sont des repertoires. Si EXPR est omise, la fonction se contente de renvoyer le umask 
courant. Par exemple, pour s'assurer que les bits « utilisateur » sont actives et que les 
bits « autres » sont desactives, essayez quelque chose comme : 

umask((umask() & 077) | 7); # ne change pas les bits "groupe" 

Rappelez-vous qu'un umask est un nombre, habituellement donne en octal ; ce n'est pas 
une chaine de chiffres octaux. Voir aussi oct, si tout ce que vous avez est une chame. 
Rappelez-vous egalement que les bits d'umask sont le complement des permissions or- 
dinaires. 

Les permissions Unix rwxr-x — sont representees comme trois ensembles de trois bits, 
ou trois chiffres octaux : 0750 (le 0 du debut indique un octal et ne compte pas comme 
un des chiffres). Puisque les bits d'umask sont complementaires, ils representent des bits 
de permissions desactivees. Les valeurs de permission (ou « mode ») que vous fournis- 
sez a mkdir ou sysopen sont modifies par votre umask, ainsi meme si vous dites a syso- 
pen de creer un fichier avec les permissions 0777, si votre umask vaut 0022, le fichier est 
cree avec les permissions 0755- Si votre umask valait 0027 (le groupe ne peux pas ecrire, 
les autres ne peuvent ni lire, ni ecrire, ni executer), alors passer a sysopen un MASQUE 
de 0666 creerait un fichier avec un mode de 0640 (puisque 0666 & ~0027 vaut 0640). 

Voici quelques conseils : donnez un mode de creation valant 0666 pour les fichiers nor- 
maux (pour sysopen) et un de 0777 a la fois pour les repertoires (pour mkdir) et pour 
les fichiers executables. Cela donne aux utilisateurs la liberte de choisir : s'ils veulent des 
fichiers proteges, ils choisiront des umasks de processus de 022, 027 ou meme le masque 
particulierement antisocial de 077. Les programmes ne doivent que rarement, si ce n'est 
jamais, prendre des decisions strategiques qu'il vaut mieux laisser a l'utilisateur. Les ex- 
ceptions a cette regie sont les programmes qui ecrivent des fichiers qui doivent rester 
prives : fichiers mails, cookies de navigateurs web, fichiers .rhosts, et ainsi de suite. 

Si umask{2) n'est pas implements sur votre systeme et que vous essayez de restreindre 
votre propre acces (c'est-a-dire, si (EXPR & 0700) > 0), vous declencherez une exception 
a l'execution. Si umask{2) n'est pas implements sur votre systeme et que vous n'essayez 
pas de restreindre votre propre acces, la fonction renverra simplement undef. 



umask 



mm 




m 



undef EXPR 
undef 
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undef est le nom sous lequel nous nous referons a l'abstraction connue sous le nom de 
la valeur indefinie. II se trouve aussi qu'il s'agit d'une fonction bien nommee qui renvoie 
toujours la valeur indefinie. Nous melangeons les deux avec joie. 

Par coincidence, la fonction undef rend explicitement indefinie une entite si vous passer 
son nom comme argument. L'argument EXPR, s'il est specifie, soit etre une lvalue. A par- 
tir de la, vous ne pouvez utilisez qu'une valeur scalaire, un tableau complet, un hachage 
complet, un nom de sous-programme (en utilisant le prefixe &) ou un typeglob. Toute 
la memoire associee a l'objet sera recuperee (mais pas renvoyee au systeme, pour la plu- 
part des systeme d'exploitation). La fonction undef ne fera probablement pas ce que 
vous attendez d'elle sur la plupart des variables speciales. L'utiliser sur des variables en 
lecture seule, comme $1, leve une exception. 

La fonction undef est un operateur unaire, non un operateur de liste, vous ne pouvez 
done rendre indefini qu'une seule chose a la fois. Voici quelques exemples d'utilisation 
d'undef en tant qu'operateur unaire : 

undef $bidule; 

undef $machin{'truc'}; # Different de delete $machin{/truc'}; 
undef (^tableau 
undef %hachage; 
undef Smonsp; 

undef *xyz # Detruit $xyz, @xyz, %xyz, &xyz, etc. 

Sans son argument, undef n'est utilise que pour sa valeur : 
select(undef , undef, undef, $sieste); 

return (wantarray ? () : undef) if $dans_les_choux; 
return if $dans_les_choux; # meme chose 

Vous pouvez utiliser undef comme un emplacement dans la partie gauche d'une affec- 
tation de liste, auquel cas la valeur correspondante de la partie droite est simplement 
rejetee. A part cela, vous ne pouvez pas utiliser undef en tant que lvalue. 

($a, $b, undef, $c) = &truc; # Ignore la troisieme valeur renvoyee 

De plus, n'essayez pas de comparer quoique ce soit avec undef — cane fait pas ce que 
vous pensez. Tout ce que ca fait, e'est comparer avec 0 ou la chaine vide. Utilisez la fonc- 
tion defined pour determiner si une valeur est definie. 



unlink ESS 

unlink LISTE 
unlink 

Cette fonction supprime une liste de fichiers. 23 La fonction renvoie le nombre de fi- 
chiers effectivement supprimes. Quelques exemples simples : 



23. En fait, sous un systeme de fichier POSIX, elle supprime les entrees de repertoire (fichiers) 
qui se referent aux veritables fichiers. Comme un fichier peut etre reference (lie) depuis plus 
d'un repertoire, le fichier lui-meme n'est pas detruit avant que la derniere reference pointant sur 
lui ne soit effacee. 
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$cpt = unlink 'a', 'b' , 'c'; 
unlink (Spartantsj 
unlink glob("*.orig"); 

La fonction unlink ne supprime pas les repertoires a moins d'etre super-utilisateur et 
que l'option de la ligne de commande -U soit donnee a Perl. Meme dans ces conditions, 
vous etes prevenus que l'effacement d'un repertoire est susceptible d'infliger des dom- 
mages severes dans votre systeme de fichiers. Employez plutot rmdir. 

Voici une commande rm tres simple avec une verification d'erreurs qui ne Test pas 
moins : 

#!/usr/bin/perl 

^impossible = grep {not unlink}, @ARGV; 

die "$0: unlink de ^impossible impossible\n" if ^impossible; 



unpack CANEVAS, EXPR 

Cette fonction fait l'inverse de pack : elle developpe une chaine (EXPR) representant une 
structure de donnees et l'eclate selon le CANEVAS en une liste de valeurs qu'elle renvoie. 
Dans un contexte scalaire, elle peut etre employee pour depaqueter une seule valeur. Le 
CANEVAS est ici a peu pres du meme format que pour la fonction pack - il specifie l'ordre 
et le type des valeurs a depaqueter. Voir pack pour une description plus detaillee de CA- 
NEVAS. Un element invalide dans le CANEVAS ou une tentative deplacement a l'exterieur 
de la chaine avec les formats x, X ou @, leve une exception. 

La chaine est decoupee en morceaux decrits dans le CANEVAS. Chaque morceau est con- 
verti separement en une valeur. Generalement, les octets de la chaine sont le resultat 
d'un pack ou ils representent une structure C d'un certain type. 

Si le compteur de repetitions d'un champ est plus grand que ce que le reste dans la chai- 
ne en entree le permet, le compteur de repetitions est decremente en douce. (Normale- 
ment, vous devriez de toute facon utiliser un compteur de repetitions valant ici *.) Si la 
chaine en entree est plus grande que ce que decrit le CANEVAS, le reste de la chaine est 
ignore. 

La fonction unpack est egalement tres utile pour les donnees de texte brut, pas seule- 
ment pour les donnees binaires. Supposez que vous ayez un fichier de donnees qui con- 
tiendrait des enregistrements ressemblant a ceci : 



2000 


Ingrid Caven 


Dean-Jacques Schuhl 


1999 


Premiere ligne 


Dean-Marie Laclavetine 


1998 


Confidence pour confidence 


Paule Constant 


1997 


La bataille 


Patrick Rambaud 


1996 


Le chasseur Zero 


Roze Pascale 


1995 


Le testament francais 


Andre Makine 


1994 


Un aller simple 


Didier Van Cauwelaert 


1993 


Le rocher de Tanios 


Amin Maalouf 


1992 


Texaco 


Patrick Chamoiseau 



vous ne pouvez pas utiliser split pour decomposer les champs car ils n'ont pas de sepa- 
rateur distinct. A la place, les champs sont determines par leur decalage d'octets dans 
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Fenregistrement. Ainsi meme s'il s'agit d'un enregistrement de texte ordinaire, puisqu'il 
est compose dans un format fixe, vous pouvez utiliser unpack pour le decomposer : 

while (<>) { 

($annee, $titre, $auteur) = unpack("A4 x A26 A*", $_); 

print "$auteur a gagne le prix Goncourt $annee pour $titre\n"; 

} 

Voici un programme uudecode complet : 

#!/usr/bin/perl 
$_ = <> 

until ($mode,$fichier) = / A begin\s*(\d*)\s*(\S*)/; 
open(SORTIE/'> $fichier") if $fichier ne ""; 
while (<>) { 

last if / A end/; 

next if /[a-z]/; 

next unless int((((ord() - 32) & 077) + 2) / 3) == 

int(length() / 4); 
print SORTIE unpack "u", $_; 

} 

chmod oct $mode, $fichier; 

En plus des champs autorises dans pack, vous pouvez prefixer un champ par Xnombie 
pour produire une somme de controle des entites sur nombre bits au lieu des entites elles- 
memes. La valeur par defaut est une somme de controle de 16 bits. La somme de con- 
trole est calculee en additionnant les valeurs numeriques des valeurs developpees (pour 
les champs de chames, on additionne ord ($car ) et pour les champs de bits, on addition- 
ne les zeros et les uns). Par exemple, ce qui suit calcule le meme nombre que le program- 
me sum(l) de System V : 

undef $/; 

$somme_controle = unpack ("%32C*" J <>) % 65536; 

L'exemple suivant compte de facon efficace le nombre de bits positionnes dans un vec- 
teur de bits : 

$bits_a_l = unpack "%32b*", $masque_de_select; 
Voici un decodeur simple MIME (BASE 64) : 
while (<>) { 

tr#A-Za-zO-9+/##cd; # enlever les caracteres non-base 64 

tr#A-Za-zO-9+/# -_#; # convertir au format uuencode 

$lng = pack("c", 32 + 0.75*length); # calculer l'octet de longueur 
print unpack("u"j $len . $_); # uudecoder et afficher 

} 

unshift 

unshift TABLEAU, LISTE 

Cette fonction fait Finverse de shift. (Ou l'inverse de push, selon le point de vue.) Elle 
ajoute une LISTE au debut du tableau et renvoie le nombre actualise d'elements dans 
le tableau : 

unshift (SiARGV, '-e', $cmd unless $ARGV[o] =~ / A -/; 
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Remarquez que la LISTE est ajoutee en entier au debut, et non un element a la fois, les 
elements ajoutes au debut restent done dans le meme ordre. Utilisez reverse pour les 
inverser. 

untie 

untie VARIABLE 

Brise le lien existant entre une variable ou un typeglob contenu dans VARIABLE et le pa- 
quetage auquel elle etait liee. Voir tie et l'integralite du chapitre 14, mais tout particu- 
lierement la section Un piege subtil du deliement. 

use [$o g 

use MODULE VERSION LISTE 
use MODULE VERSION () 
use MODULE VERSION 
use MODULE LISTE 
use MODULE () 
use MODULE 
use VERSION 

La declaration use charge un module, s'il n'a pas deja ete charge auparavant, et importe 
depuis ce module des sous-programmes et des variables dans le paquetage courant. (En 
langage technique, elle importe depuis le module donne des semantiques dans votre pa- 
quetage.) La plupart des declarations use ressemblent a : 

use MODULE LISTE ; 

Ce qui est exactement equivalent a : 

BEGIN { require MODULE ; import MODULE LISTE ; } 

Le BEGIN force le require et le import a se produire au moment de la compilation. Le 
require s'assure que le module est charge en memoire s'il ne Test pas deja. L'import 
n'est pas une fonction interne — e'est simplement un appel ordinaire de methode dans 
le package nomme par MODULE pour demander a ce module de mettre la liste des fonc- 
tionnalites dans le package courant. Le module peut implementer sa methode d'impor- 
tation de la maniere qui lui plait, bien que la plupart choisissent simplement de deriver 
leur methode d'importation par heritage de la classe Exporter qui est definie dans le 
module Exporter. Voir le chapitre 11, Modules et le module Exporter pour plus d'infor- 
mations. Si aucune methode import ne peut etre trouvee, l'appel est abandonne sans 
un mot. 

Si vous ne voulez pas alterer votre espace de nom, fournissez explicitement une liste 
vide : 

use MODULE (); 

Ce qui est exactement equivalent a : 

BEGIN { require MODULE ; } 

Si le premier argument de use est un numero de version comme 5.6.2, la version cou- 
rante de Perl en train de s'executer doit etre au moins aussi recente que la version spe- 
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cifiee. Si la version actuelle de Perl est inferieur a VERSION, un message d'erreur est 
affiche et l'interpreteur Perl se termine immediatement. Ceci est tres utile pour verifier 
la version courante de Perl avant de charger des modules de bibliotheque qui depen- 
dent des nouvelles versions, puisque de temps en temps, nous avons besoin de « casser » 
les mauvaises fonctionnalites des anciennes versions de Perl. (Nous n'essayons pas de 
casser plus de choses que necessaire. En fait nous essayons souvent de casser moins de 
choses que necessaire.) 

Et puisque nous parlons de ne pas casser certaines choses, Perl accepte encore les anciens 
numeros de versions de la forme : 

use 5.005_03; 

Toutefois, pour mieux s'aligner avec les standards de Findustrie, Perl 5.6 accepte desor- 
mais (et nous preferons voir) la syntaxe sous forme d'un triplet : 

use 5.6.0; # Soit, version 5, sous-version 6, correctif 0. 

Si l'argument VERSION est present apres MODULE, alors le use appellera la methode VER- 
SION de la classe MODULE avec la VERSION donnee comme argument. Remarquez qu'il n'y 
pas de virgule apres VERSION ! La methode VERSION par defaut, qui est heritee de la classe 
UNIVERSAL, meurt en gemissant si la version donnee est plus elevee que la valeur de la 
variable $Module: : VERSION. 

Voir le chapitre 32 pour une liste des modules standards. 

Comme use fournit une interface largement ouverte, les pragmas (directives de compi- 
lation) sont egalement implementes via des modules. Les pragmas actuellement imple- 
mentees comprennent : 

use autouse 'Carp' => qw(carp croak); 
use bytes; 

use constant PI => 4 * atan2(l,l); 
use diagnostics; 
use integer; 

use lib Vopt/projets/spectre/lib J ; 
use locale; 

use sigtrap qw (die INT QUIT); 
use strict qw(subs vars refs); 
use warnings "deprecated"; 

La plupart des ces modules pragmatiques importent des definitions dans la portee lexi- 
cale courante. (Au contraire des modules ordinaires, qui n'importent des symboles que 
dans le paquetage courant, qui a une rapport minime avec la portee lexicale courante 
autre que le fait que la portee lexicale est compilee avec ce paquetage a l'esprit. Ceci 
pour dire que. . . oh et puis zut, voyez le chapitre 11.) 

II existe une declaration correspondante, no, qui « desimporte » toutes les significations 
importees a l'origine avec use qui sont devenues depuis, heu, sans importance : 

no integer; 

no strict 'refs'; 

no utf8; 

no warnings "unsafe"; 
Voir le chapitre 31 pour une liste des pragmas standards. 
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utime a m S 

utime LISTE 

Cette fonction change les dates d'acces et de modification sur chacun des fichiers de la 
liste. Les deux premiers elements de la liste doivent etre les dates d'acces et de modifica- 
tion en numerique, dans cet ordre. La fonction renvoie le nombre de fichiers changes 
avec succes. La date de modification d'inode de chaque fichier est fixee a la date couran- 
te. Voici un exemple d'une commande touch qui met la date de modification du fichier 
(en supposant que vous en etes le proprietaire) a environ un mois dans le futur : 

#!/usr/bin/perl 

# touchjnois - antidate les fichiers a maintenant + 1 mois 
$jour = 24 * 60 * 60; # 24 hemes en secondes 
$plus_tard = timeQ + 30 * $jour; # 30 jours, c'est environ un mois 
utime $plus_tard, $plus_tard, @ARGV; 

et voici un exemple un peu plus sophistique d'une commande qui fait un touch avec 
quelques notions de controle d'erreurs : 

#!/usr/bin/perl 

# touchjnois - antidate les fichiers a maintenant + 1 mois 
$plus_tard = timeQ + 30 * 24 * 60 * 60; 

^impossibles = grep {not utime $plus_tard, $plus_tard, $_} @ARGV; 
die "touch impossible de (^impossibles. \n" if ^impossibles; 

Pour lire les dates de fichiers existants, utilisez stat et passez les champs appropries a 
localtime ou gmtime pour l'affichage. 

values 

values HACHAGE 

Cette fonction renvoie une liste constitute de toutes les valeurs du HACHAGE indique. Les 
valeurs sont renvoyees dans un ordre apparemment aleatoire, mais c'est le meme que 
celui produit par les fonctions keys ou each pour le meme hachage. Curieusement, 
pour trier un hachage par ses valeurs, vous aurez besoin habituellement de la fonction 
keys, regardez done l'exemple dans la description de keys. 

Vous pouvez modifier les valeurs d'un hachage en utilisant cette fonction car la liste ren- 
voyee contient des alias des valeurs et pas simplement des copies. (Dans les versions pre- 
cedentes, vous aviez besoin d'utiliser pour ce faire une portion de hachage.) 

for (|5>hachage{keys %hachage}) { s/machin/truc/g } # ancienne maniere 
for (values %hachage) { s/machin/truc/g } # modifie maintenant 

# les valeurs 

L'emploi de values sur un hachage lie a un fichier DBM important est voue a produire 
une liste toute aussi volumineuse, ce qui vous donnera un processus important. II peut 
etre preferable pour vous d'utiliser dans ce cas la fonction each, qui parcourra les en- 
trees de hachage une a une, sans les absorber en une liste gargantuesque. 
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vec \M 

vec EXPR, DECALAGE, BITS 

La fonction vec foumit un stockage compact de listes d'entiers non-signes. Ces entiers 
sont empaquetes et compresses autant que possible dans une chame Perl ordinaire. La 
chame dans EXPR est traitee comme une chaine de bits construite a partir d'un nombre 
arbitraire d'elements selon la longueur de la chaine. 

DECALACE specifie l'indice de l'element particulier qui vous interesse. Les syntaxes pour 
lire et ecrire l'element sont les memes, puisque vec stocke la valeur de l'element selon 
que vous utilisiez un contexte lvalue ou rvalue. 

BITS specifie l'etendue d'un element en bits, ce qui doit etre exprime en puissance de 
2: 1,2, 4, 8, 16 ou 32 (et egalement 64 sur certaines plates-formes). (Une exception est 
levee si une quelconque autre valeur est utilisee.) Chaque element peut ainsi contenir 
un entier compris dans l'intervalle 0 . . (2**BIT5)-1. Pour les plus petites tailles, on em- 
paquete dans chaque octet autant d'elements que possible. Lorsque BITS vaut 1, il y a 
huit elements par octets. Lorsque BITS vaut 2, il y a quatre elements par octets. Lorsque 
BITS vaut 4, il y a deux elements (habituellement appeles des quartets) par octets. Et 
ainsi de suite. Les entiers plus grands qu'un octet sont stockes dans Fordre gros-boutise 
{NAT. : big-endian). 

Une liste d'entiers non-signes peut etre stockee dans une simple variable scalaire en les 
assignant individuellement a la fonction vec. (Si EXPR n'est pas une lvalue valide, une 
exception est levee.) Dans l'exemple suivant les elements font tous 4 bits de large : 

$chaine_bits = ""; 
$decalage = 0; 

foreach $nb (0, 5, 5, 6, 2, 7, 12, 6) { 

vec($chaine_bits, $decalage++, 4) = $num; 

} 

Si un element est ecrit apres la fin de la chaine, Perl etendra d'abord la chaine avec suf- 
fisamment d'octets a zero. 

Les vecteurs stockes dans la variable scalaire peuvent par la suite etre atteints en speci- 
fiant le DECALAGE correct : 

$nb_elements = length($chaine_bits)*2; # 2 elements par octet 

foreach $decalage (0 .. nb_elements-l) { 

print vec($chaine_bits, $decalage, 4), "\n"; 

} 

Si l'element selectionne se situe apres la fin de la chaine, une valeur de 0 est renvoyee. 

Les chaines creees avec vec peuvent egalement etre manipulees avec les operateurs lo- 
giques | , &, A et ~. Ces operateurs postulent qu'une operation de vecteurs de bits est de- 
siree quand les deux operandes sont des chaines. Voir des exemples de ceci au chapitre 
3, Operateurs unaires et binaires, dans la section Operateurs sur les bits. 

Si BITS == 1, une chame de bits peut etre creee pour stocker une serie de bits dans un 
seul scalaire. L'ordre est tel que Ton garanti que vec($chaine_bits,0, l) part du bit le 
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plus faible du premier octet de la chaine. 

@bits = (0,0,1,0, 1,0,1,0, 1,1,0,0, 0,0,1,0); 

$chaine_bits = ""; 
$decalage = 0; 

foreach $bit (@bits) { 

vec($chaine_bits, $decalage++, l) = $bit; 

} 

print "$chaine_bit\n"; # "TC", i.e. '0x54' , '0x43' 

Une chaine de bits peut etre convertie vers ou depuis une chaine de 1 et de 0 en donnant 
un canevas de « b* » a pack ou unpack. Dans l'autre sens, pack peut etre utilise avec un 
canevas de « b* » pour creer la chaine de bits depuis une chaine de 1 et de 0. L'ordre est 
compatible avec celui que vec attend. 

chaine_bits = pack "b*", join(", @bits); 

print "$chaine_bits\n"; # "TC" comme precedemment 

unpack peut etre utilise pour extraire la liste de 0 et de 1 de la chaine de bits. 

@bits = split (//, unpack("b*", $chaine_bits)); 

print "@bits\n"; #0010101011000010 

Si vous connaissez la longueur exacte en bits, celle-ci peut etre utilisee en lieu et place 
de « * ». 

Voir select pour des exemples supplementaires d'utilisation de bitmaps generees avec 
vec. Voir pack et unpack pour des manipulations de donnees binaires a un niveau supe- 
rieur. 



wait asm 

wait 

Cette fonction attend qu'un processus fils se termine et renvoie le PID du processus de- 
cede, ou -1 s'il n'y a pas de processus fils (ou sur certains systemes, si les processus fils 
sont automatiquement enterres). Le statut est renvoye dans $? comme nous l'avons de- 
crit pour la fonction system. Si vous obtenez des processus fils zombies, vous devrez ap- 
peler cette fonction, ou waitpid. 

S'il n'y a pas de fils, contrairement a votre attente, il s'est probablement produit un ap- 
pel a system, une fermeture de pipe ou des apostrophes inverses entre le fork et le wait. 
Ces constructions provoquent egalement une attente avec wait(2) et peuvent avoir re- 
colte votre processus fils. Utilisez waitpid pour eviter ce probleme. 



waitpid grj S3 DU 

waitpid PID, FLAGS 

Cette fonction attend qu'un certain processus fils se termine et renvoie le PID quand le 
processus est mort, -1 s'il n'y a pas de fils, ou 0 si les FLAGS specifient un appel non-blo- 
quant et que le processus n'est pas encore mort. Le statut du processus mort est renvoye 
dans $? comme nous l'avons decrit pour la fonction system. Pour obtenir les valeurs va- 
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lides des flags, vous devrez importer le tag de groupe d'importation " : sys_wait . h" de- 
puis le module POSIX. Voici un exemple qui realise une attente non-bloquante des 
processus zombies : 

use POSIX ":queue"; 
do { 

$fils = waitpid(-l, &WN0HANG); 
} until $fils == -l; 

Sur les systemes qui n'implementent pas les appels systeme waitpid(2) et wait4(2), les 
FLAGS ne peuvent etre specifies qu'a 0. En d'autres termes, vous pouvez attendre la un 
PID specifique, mais vous ne pouvez le faire en mode non-bloquant. 

Sur certains systemes, une valeur de retour de - 1 peut signifier que les processus fils sont 
automatiquement enterres car vous avez fait $SIG{CHLD} = 'IGNORE'. 

wantarray 

wantarray 

Cette fonction renvoie vrai si le contexte du sous-programme actuellement en train de 
s'executer demande une valeur tableau et faux sinon. La fonction renvoie une valeur de- 
finie fausse (" ") si le contexte appelant demande un scalaire et la valeur indefinie fausse 
(undef ) si le contexte appelant ne demande rien de particulier, c'est-a-dire s'il s'agit d'un 
contexte vide. 

Voici quelques exemples d'usages typiques : 

return unless defined wantarray; # ne se preoccupe pas d'en faire plus 
my @>a = calcul_complique(); 
return wantarray ? @a : \@a; 

Voir egalement caller. Cette fonction aurait vraiment du s'appeler « wantlist » mais 
nous l'avons baptisee alors que les contextes de listes s'appelaient encore contextes de 
tableaux. 



warn @ 

warn LISTE 
warn 

Cette fonction produit un message d'erreur en affichant LISTE sur STDERR exactement 
comme die, mais sans essayer de sortir ou de lancer une exception. Par exemple : 

warn "Debogage actif" if $debug; 

Si LISTE est vide et que $@ contient deja une valeur (generalement issue d'un eval pre- 
cedent), la chaine "\t. . .caught" est ajoutee a la fin de $@ sur STDERR. (De maniere si- 
milaire a celle dont die propage les erreurs, excepte le fait que warn ne propage (leve a 
nouveau) pas l'exception.) Si la chaine de message fournie est vide, le message 
« Warning: Something's wrong » 24 est utilise. 



24. N.d.T. : Litteralement : « Avertissement : II y a quelque chose de mauvais ». 
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Si la chame de message fournie ne se termine pas par un saut de ligne, les informations 
concernant le fichier et le numero de ligne sont automatiquement ajoutees a la fin. La 
fonction warn n'a aucun rapport avec l'option de la ligne de commande de Perl -w, mais 
elle peut etre utilisee en conjonction avec cette derniere, comme lorsque vous voulez 
emuler le comportement interne : 

warn "Quelque chose de foncierement mauvais\n" if $ A W; 

Aucun message n'est affiche si un gestionnaire pour $SIG{ WARN } est installe. II ap- 

partient au gestionnaire d'en decider si le message lui semble approprie. Une chose que 
vous pourriez vouloir faire est de promouvoir un simple avertissement en exception : 

local $SIG{_WARN_} = sub { 
my $msg = shift; 

die $msg if $msg =~ /n'est pas numerique/; 

} 

La plupart des gestionnaires doivent done faire prendre leurs dispositions pour afficher 
les avertissements qu'ils n'ont pas prevu de gerer, en appelant a nouveau warn dans le 
gestionnaire. Ceci est tout a fait stir ; il n'y aura pas de boucles sans fin car les routines 

WARN ne sont pas appelees depuis des routines WARN . Ce comportement differe 

un peu de celui des gestionnaires de $SIC{ DIE } (qui ne suppriment pas le texte d'er- 

reur mais qui peuvent a la place appeler une nouvelle fois die pour le changer). 

L'emploi d'un gestionnaire WARN donne un moyen particulierement puissant de tai- 

re tous les avertissements, mime ceux qui sont pourtant qualifies d'obligatoires. Parfois, 
vos aurez besoin d'encapsuler cela dans un bloc BEGIN{} pour que ce soit pris en compte 
des la compilation : 

# nettoie *tous* les avertissements a la compilation 

BEGIN { $SIG{_WARN_} = sub { warn $_[0] if $AVERTISSEMENTS_ACTIFS } } 
my $truc = 10; 

my $truc = 20; # pas divertissement a propos des my $truc 

# dupliques mais, bon, vous Pavez voulu ! 

# pas divertissements a la compilation ou a l'execution jusqu'ici; 
$AVERTISSEMENTS_ACTIFS =1; # avertissements a l'execution actives 

#a partir d'ici 
warn "\$truc est vivant et vaut $truc !"; # denonce tout 

Voir le pragma use warnings pour le controle de la portee lexicale des avertissements. 
Voir les fonctions carp et cluck du module Carp pour d'autres moyens de produire des 
messages d'avertissement. 



write \E g @ 

write HANDL E_ FICHIER 
write 

Cette fonction ecrit un enregistrement formate (qui peut etre multilignes) vers le han- 
dle de fichier specifie, en utilisant le format associe a ce handle de fichier — voir la sec- 
tion Variables de format au chapitre 7. Par defaut, le format d'un fichier est celui qui a le 
meme nom que le handle de fichier. Toutefois, le format d'un handle de fichier peut 
etre modifie en changeant la variable $~ apres avoir fait un select sur ce handle : 
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$ancien hf = select(HANDLE); 
$~ = "NOUVEAUJIOM"; 
select($ancien hf ) ; 

ou en ecrivant : 

use 10: :Handle; 

HANDLE - >f ormatjiame ( " NOUVEAU_NOM " ) ; 

Puisque les formats sont mis dans l'espace de nom d'un paquetage, il se peut que vous 
deviez qualifier le nom du format si le format a ete declare dans un paquetage different : 

$~ = "Autre_Paquetage: :N0UVEAU_N0M"; 

Le traitement de l'en-tete de formulaire est automatiquement gere : s'il n'y a plus assez 
de place sur la page courante pour l'enregistrement formate, la page est avancee en ecri- 
vant un saut de page, un format de haut de page special est utilise pour formater le nou- 
vel en-tete de page, et l'enregistrement est enfin ecrit. Le nombre de lignes restant sur 
la page courante se trouve dans la variable $-, qui peut etre mise a 0 pour forcer qu'une 
nouvelle page soit prise au prochain write. (Vous devrez peut etre selectionner 
d'abord le handle de fichier.) Par defaut, le nom du format de haut de page est celui du 
handle de fichier auquel est ajoute « _T0P », mais il peut etre modifie en changeant la 
variable $ A apres avoir fait un select sur ce handle ou en ecrivant : 

use 10: :Handle; 

HANDLE - >f ormat_top_name ( " NOUVE AU_N0M_T0P " ) ; 

Si HANDLE_FICHIER n'est pas specifie, ce qui est ecrit sort sur le handle de fichier de sortie 
par defaut, qui est STDOUT au depart mais peut etre change par la forme a un seul argu- 
ment de l'operateur select. Si HANDLE_FICHIER est une expression, celle-ci est evaluee 
pour determiner le veritable HANDLE_FICHIER a l'execution. 

Si un format specifie ou le format de l'en-tete de page courant n'existe pas, une excep- 
tion est levee. 

La fonction write n'est pas l'inverse de read. Utilisez print pour une simple ecriture de 
chaine. Si vous avez consulte cette entree parce que vous voulez court-circuiter les en- 
trees/sorties standard, regardez syswrite. 



II s'agit de l'operateur de traduction (appele aussi translation), egalement connu sous le 
nom de tr///. Voir le chapitre 5. 




y/// 
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La bibliotheque 
standard Perl 



La distribution standard de Perl contient bien plus que l'executable perl qui execute vos 
scripts. Elle inclue egalement des centaines de modules remplis de code reutilisable. 
Comme les modules standards sont disponibles partout, si vous utilisez l'un d'entre eux 
dans votre programme, vous pouvez faire tourner votre programme partout ou Perl est 
installe, sans etapes d'installation supplementaires. 

Bibliothequologie 

Avant d'enumerer ces modules dans les prochains chapitres, passons quelque peu en re- 
vue la terminologie dans laquelle nous nageons jusqu'au cou. 

espace de noms 

Les noms sont conserves dans un espace de noms afin de ne pas les confondre avec 
des noms identiques dans des espaces differents. Ainsi reste a ne pas confondre les 
espaces de noms entre eux. II existe deux manieres d'eviter cela : leur donner des 
noms uniques ou leur attribuer des emplacements uniques. Perl vous laisse faire les 
deux : les espaces de noms nommes s'appellent des paquetages et les espaces de 
noms anonymes sont appeles portees lexicales. Puisque les portees lexicales ne peu- 
vent pas s'etendre au-dela d'un fichier et puisque les modules standards sont (au 
minimum) de la taille d'un fichier, il s'ensuit que toutes les interfaces de modules 
doivent employer des espaces de noms nommes (des paquetages) si quelqu'un doit 
les utiliser depuis l'exterieur du fichier. 

paquetage 

Un paquetage est un mecanisme standard de Perl pour declarer un espace de noms 
nomme. II s'agit d'un mecanisme tres simple pour rassembler des fonctions et des 
variables qui ont des points communs. Tout comme deux repertoires peuvent con- 
tenir tous deux un fichier (different) s'appelant fred, deux parties d'un programme 
Perl peuvent, chacune de leur cote, avoir leur propre variable $f red ou leur propre 
fonction &fred. Meme si ces variables ou ces fonctions semblent avoir le meme 
nom, ces noms resident dans des espaces de noms distincts geres par la declaration 
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package. Les noms de paquetages sont utilises pour identifier a la fois des modules 
et des classes, comme nous l'avons decrit au chapitre 11, Modules et au chapitre 12, 
Objets. 

bibliotheque 

Le terme bibliotheque (library) est malheureusement suremploye dans la culture 
Perl. De nos jours, nous utilisons normalement le terme pour designer l'ensemble 
des modules Perl installed sur votre systeme. 

Historiquement, une bibliotheque Perl etait egalement un simple fichier conte- 
nant une collection de sous-programmes partageant un objectif commun. Un tel 
fichier est souvent suffixe par .pi, pour « perl library ». Nous employons toujours 
cette extension pour des morceaux varies de code Perl que vous incorporez avec do 
FICHIER ou require. Bien qu'il ne s'agisse pas d'un module a part entiere, un 
fichier de bibliotheque se declare generalement lui-meme comme etant dans un 
paquetage distinct, ainsi les variables et les sous-programmes qu'il contient peuvent 
etre rassemblees et n'interferent pas accidentellement avec d'autres variables dans 
votre programme. II n'y a pas d'extension de fichier obligatoire ; en outre, on ren- 
contre souvent d'autres .pi comme nous le verrons plus loin dans ce chapitre. Ces 
fichiers de bibliotheques simples et sans structure ont ete largement supplantes par 
les modules. 

module 

Un module Perl est un fichier de bibliotheque conforme a certaines conventions 
specifiques qui autorisent un ou plusieurs fichiers implementant ce module a etre 
rentres avec une seule declaration use a la compilation. Les noms de fichier des 
modules doivent toujours se terminer par .pm, car la declaration use le presuppose. 
La declaration use convertira egalement le separateur de paquetage : : vers votre 
separateur de repertoire quel qu'il soit afin que la structure des repertoires dans 
votre bibliotheque Perl puisse ref leter la structure de votre paquetage. Le chapitre 
11 decrit comment creer vos propres modules Perl. 

classe 

Une classe est juste un module qui implemente des methodes pour les objets asso- 
cies au nom du paquetage du module. Si les modules orientes objet vous interes- 
sent, voyez le chapitre 12. 

pragma 

Un pragma est juste un module special qui fait joujou avec les boutons internes de 
Perl. Voir le chapitre 31, Modules de pragmas. 

extension 

Une extension est un module Perl qui, en plus de charger un fichier .pm, charge ega- 
lement un bibliotheque partagee implementant en C ou en C++ la semantique du 
module. 

programme 

Un programme Perl est un code concu pour tourner en tant qu'entite 
independante ; il est egalement connu sous le nom de script lorsque vous ne voulez 
pas que quiconque en attende un peu trop, sous le nom (^application lorsqu'il est 
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volumineux et complique, sous le nom ^executable lorsque celui qui l'appelle ne se 
soucie pas du langage dans lequel il a ete ecrit, ou encore sous le nom de solution 
industrielle lorsqu'il coute une fortune. Les programmes Perl existent en tant que 
code source, bytecode ou code machine natif. S'il s'agit de quelque chose que vous 
pouvez lancer depuis la ligne de commande, nous l'appellerons un programme. 

Visite guidee de la bibliotheque Perl 

Vous gagnerez enormement de temps si vous faites l'effort de vous familiariser avec la 
bibliotheque Perl standard, car il n'y a aucune raison de reinventer la roue. Nous devons 
toutefois vous avertir que cette collection contient un vaste champ de matieres premie- 
res. Bien que certaines bibliotheques soit extremement utiles, d'autres peuvent etre sans 
aucun rapport avec vos besoins. Par exemple, si vous n'ecrivez que du code Perl pur a 
100 %, les modules qui supportent le chargement dynamique d'extensions C et C++ ne 
vont pas beaucoup vous aider. 

Perl s'attend a trouver les modules de bibliotheque quelque part dans son chemin d'in- 
clusion (N.d.T. : « include ») de bibliotheque, @INC. Ce tableau specifie la liste ordonnee 
des repertoires ou Perl cherche lorsque vous chargez du code de bibliotheque en utili- 
sant les mots clefs do, require ou use. Vous pouvez facilement afficher la liste de ces re- 
pertoires en appelant Perl avec l'option -V pour Version Vraiment Verbeuse, ou avec ce 
simple code : 

% perl -le "print foreach @INC" 

/usr/libdata/perl5/sparc-openbsd/5. 00503 
/usr/local/libdata/perl5/sparc-openbsd/5. 00503 
/usr/libdata/perl5 
/usr/local/libdata/perl5 

/usr/local/libdata/perl5/site_perl/sparc-openbsd 
/usr/libdata/perl5/site_perl/sparc-openbsd 
/usr/local/libdata/perl5/site_perl 
/usr/libdata/perl5/site_perl 

II ne s'agit que d'un exemple d'affichage possible. Chaque installation de Perl utilise ses 
propres chemins. Le point important est que, malgre la variation des contenus selon la 
politique de votre constructeur et de celle de l'installation sur votre site, vous pouvez 
compter sur toutes les bibliotheques standards qui sont installees avec Perl. Si vous vou- 
lez retrouver l'endroit depuis lequel un fichier a ete reellement charge, consultez la va- 
riable %INC. Pour un fichier de module, vous pouvez trouver exactement oil Perl Fa 
trouve avec cette commande : 

% perldoc -1 MODULE 

Si vous regardez les repertoires de @INC et leurs sous-repertoires, vous trouverez diffe- 
rentes sortes de fichiers installes. La plupart ont des noms se terminant par .pm, mais 
certains se finissent par .pi, .ph, .al ou .so. Ceux qui vous interessent le plus sont dans la 
premiere categorie car un suffixe .pm indique que le fichier est un module Perl authen- 
tique. Nous en dirons plus sur ceux-la dans un instant. 

Le peu de fichiers que vous verrez la finissant par .pi sont ces vieilles bibliotheques Perl 
que nous avons mentionnees plus haut. lis sont inclus pour garder une compatibility 
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avec d'anciennes versions de Perl datant des annees 80 et du debut des annees 90. Ainsi, 
le code Perl qui marchait, disons en 1990, doit continuer a bien se comporter sans his- 
toires meme si vous avez installe une version moderne de Perl. Lorsque vous etes en 
train d'ecrire du code nouveau, vous devez toujours preferer, lorsque c'est possible, uti- 
liser la version avec .pm plutot que celle avec .pi. Ainsi, les modules ne pollueront pas 
votre espace de noms comme beaucoup des vieux fichiers .pi le font. 

Une remarque a propos de l'emploi de l'extension .pi : elle signifie Perl library (biblio- 
theque Perl), et non pas programme Perl. Bien que l'extension .pi soit utilisee pour 
identifier les programmes Perl sur les serveurs web qui ont besoin de distinguer, dans 
le meme repertoire, les programmes executables des contenus statiques, nous vous sug- 
gerons d'employer un suffixe de .plx a la place pour indiquer un programme Perl exe- 
cutable. (Le meme conseil vaut pour les systemes d'exploitation qui choisissent les 
interpreters en se basant sur les extensions des noms de fichiers.) 

Les fichiers avec des extensions .al sont de petits morceaux de modules plus grands qui 
sont automatiquement charges lorsque vous utiliser leur fichier parent .pm. Si vous 
construisez le plan de votre module en utilisant l'outil standard h2xs qui est fourni avec 
Perl (et si vous n'avez pas employer le flag Perl -A), la procedure make install utilisera 
le module Autoloader pour creer pour vous ces petits fichiers .al. 

Les fichiers .ph sont construits par le programme h2ph, un outil quelque peu vieillissant 
mais parfois toujours utile pour convertir des directives de preprocesseur C vers du Perl. 
Les fichiers .ph resultants contiennent des constantes parfois necessaires aux fonctions 
de bas niveau comme ioctl, f nctl ou syscall. (De nos jours la plupart de ces valeurs 
sont disponibles, plus facilement et de maniere plus portable, dans des modules stan- 
dards comme POSIX, Errno, Fcntl ou Sockets.) Voir perlinstall pour savoir comment 
installer ces composants optionnels mais parfois importants. 

La derniere extension que vous pourriez rencontrer en errant ici et la est .so (ou ce que 
votre systeme emploie pour les bibliotheques partagees). Ces fichiers .50 sont des por- 
tions de modules d'extension qui sont dependantes de la plate-forme. Elles sont ecrites 
en C ou en C++ et il faut les compiler pour obtenir le code objet relogeable dynamique- 
ment. L'utilisateur final n'a de toute facon pas besoin d'etre au courant de leur existence 
car elles sont masquees par l'interface du module. Lorsque le code de l'utilisateur dit re- 
quire Module ou use Module, Perl charge Module.pm et l'execute, ce qui laisse le module 
attirer a lui toute autre partie necessaire, comme Module.so ou tous les composant .al 
autocharges. En fait, le module peut charger tout ce qui lui plait, y compris 582 autres 
modules. II peut telecharger l'integralite de CPAN s'il le veut et pourquoi pas les archi- 
ves des deux dernieres annees de freshmeat.net. 

Un module n'est pas simplement un morceau de code statique en Perl. C'est un agent 
actif qui arrive a comprendre comment implementer pour vous une interface. II peut 
suivre toutes les conventions standards, ou pas. II lui est permis de tout faire pour per- 
vertir la signification du reste de votre programme, y compris jusqu'a convertir le reste 
de votre programme en SPITBOL. Ce genre de canular est considere comme etant par- 
faitement loyal pour autant qu'il soit bien documente. Lorsque vous utilisez un tel mo- 
dule Perl, vous acceptez son contrat, non un contrat standard ecrit par Perl. 

Vous feriez done mieux de lire les petits caracteres de la notice. 
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Un pragma est un type particulier de module qui affecte la phase de compilation de vo- 
tre programme. Certains modules de pragmas (ou pragmata, pour faire court, ou prag- 
mas, pour faire encore plus court) peuvent egalement affecter la phase d'execution de 
votre programme. Voyez-les comme des indications donnees au compilateur. Comme 
ils ont besoin d'etre visibles a la compilation, ils ne fonctionnent que lorsqu'ils sont in- 
voques par un use ou un no, car lorsqu'un require ou un do s'execute, la compilation 
est finie depuis longtemps. 

Par convention, les noms de pragmas sont ecrit en minuscules car les noms de modules 
en minuscules sont reserves pour la distribution Perl elle-meme. Lorsque vous ecrivez 
vos propres modules, utilisez au moins une lettre majuscule pour eviter d'entrer en con- 
flit avec les noms de pragmas. 

Au contraire des modules ordinaires, la plupart des pragmas limitent leurs effets au res- 
te du bloc le plus interne encadrant l'endroit d'ou ils ont ete appeles. En d'autres termes, 
ils sont limites a une portee lexicale, exactement comme les variables my. Habituelle- 
ment, la portee lexicale d'un bloc exterieur couvre tout bloc interieur inclus dans le pre- 
mier, mais un bloc interieur peut contredire un pragma de portee lexicale provenant 
d'un bloc exterieur avec l'instruction no : 

use strict; 
use integer; 
{ 

no strict 'iefs'; # permet les references symboliques 

no integer; # reprend l'arithmetique en virgule flottante 

# ... 

} 

Plus encore que les autres modules inclus dans la distribution Perl, les pragmas forment 
une partie integrate et essentielle de l'environnement de compilation en Perl. II est dif- 
ficile de bien utiliser le compilateur si vous ne savez pas comment lui passer des indica- 
tions, nous produirons done un effort supplemental a decrire les pragmas. 
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Un autre point auquel il faut preter attention est le fait que nous utilisons souvent les 
pragmas pour prototyper des fonctionnalites qui seront plus tard encodees dans une 
syntaxe « reelle ». Ainsi vous verrez dans quelques programmes des pragmas deprecies 
comme use attrs dont la fonctionnalite est maintenant directement supportee par la 
syntaxe de declaration des sous-programmes. De meme, use vars est en cours de rem- 
placement par les declarations our. Et use subs peut un jour etre remplace par un attri- 
but override dans les declarations de sous-programmes ordinaires. Nous ne sommes 
pas extremement presses de casser les anciennes pratiques mais nous pensons assure- 
ment que les nouvelles pratiques sont plus jolies. 

use attributes 

sub une_fonct : method; 

my $fermeture = sub : method { }; 

use attributes; 

(5>liste_attrs = attributes: : get (\&une_fonct); 

Le pragma attributes a deux objectifs. Le premier est de fournir un mecanisme interne 
pour declarer des listes d'attributs, qui sont des proprietes optionnelles associees aux de- 
clarations de sous-programmes et (dans un futur proche) aux declarations de variables. 
(Puisqu'il s'agit d'un mecanisme interne, vous ne devriez pas en general utiliser ce prag- 
ma directement.) Le second objectif est de fournir un moyen de recuperer ces listes d'at- 
tributs a l'execution en appelant la fonction attribute : : get. Dans cette fonctionnalite, 
attributes est juste un module standard et non un pragma. 

Perl ne gere actuellement qu'un petit nombre d'attributs en interne. Les attributs spe- 
cifiques a un paquetage sont autorises par le biais d'un mecanisme d'extension experi- 
mental decrit dans la section Package-specific Attribute Handling (N.d.T. : gestion 
d'attributs specifiques a un paquetage) de la page de man attributes(3). 

Le positionnement des attributs intervient a la compilation ; la tentative de positionner 
un attribut inconnu provoque une erreur de compilation. (L'erreur peut etre intercepee 
avec eval, mais elle continuera d'arreter la compilation a l'interieur du bloc eval.) 

II n'existe actuellement que trois attributs internes implementes pour les sous-program- 
mes : locked, method et lvalue. Voir le chapitre 6, Sous-programmes et le chapitre 7, 
Threads, pour une discussion approfondie sur ces attributs. II n'existe pas actuellement 
d'attributs internes pour les variables comme il y en a pour les sous-programmes mais 
nous en avons plusieurs en tete que nous aimons bien, comme constant. 

Le pragma attributes fournit deux sous-programmes pour un usage generique. lis 
peuvent etre importes si vous les demandez : 

get 

Cette fonction renvoie une liste (qui peut etre vide) des attributs lorsqu'on lui 
donne un seul parametre en entree, lequel est une reference a un sous-programme 
ou a une variable. La fonction leve une exception en invoquant Carp: : croak si on 
lui passe des arguments invalides. 
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reftype 

Cette fonction se comporte plus ou moins comme la fonction interne ref mais elle 
renvoie toujours le type de donnee sous-jacent intrinseque a Perl ou la valeur refe- 
rencee, en ignorant tout paquetage dans lequel elle pourrait avoir ete consacree. 

Des details plus precis sur la gestion des attributs sont toujours en cours de discussion, 
vous feriez done mieux de consulter la documentation en ligne de votre distribution de 
Perl pour savoir quel est l'etat en cours. 

use autouse 

use autouse 'Carp' => qw(carp croak); 

carp "Cet appel a carp a ete predeclare avec autouse\n"; 

Ce pragma fournit un mecanisme pour une demande de chargement a l'execution d'un 
module particulier si et seulement si une fonction de ce module est reellement appelee. 
II accomplit ceci en donnant une souche (stub) de fonction qui est remplacee par l'appel 
reel lorsqu'on la declenche. Dans l'esprit, ce mecanisme est similaire au comportement 
des modules standards AutoLoader et Self Loader. Pour faire court, e'est une astuce de 
performance qui facilite le demarrage plus rapide (en moyenne) de votre programme 
Perl en evitant la compilation de modules qui pourraient ne jamais etre appeles durant 
une execution donnee du programme. 

Le comportement de autouse est lie au fait que le module soit deja charge ou non. Par 
exemple, si le module Module est deja charge, alors la declaration : 

use autouse 'Module' => qw(foncl fonc2($;$) Module: :fonc3); 

est equivalente a la simple importation de deux fonctions : 

use Module qw(foncl fonc2); 

Cela suppose que Module definisse fonc2 avec le prototype ($;$) et que fonclQ et 
fonc3() n'aient pas de prototype. (Plus generalement, cela suppose egalement que Mo- 
dule utilise la methode import du module standard Exporter ; sinon, une exception est 
levee.) Dans tous les cas, la declaration Module: :fonc3 est ignoree puisqu'elle est certai- 
nement deja declaree. 

Si, d'un autre cote, Module n'a pas encore ete charge lorsque le pragma autouse est ana- 
lyse, ce dernier declare les fonctions f oncl et f onc2 dans le paquetage courant. II declare 
egalement une fonction Module: :fonc3 (ce que Ton pourrait analyser comme etant le- 
gerement anti-social, si ce n'est que l'absence du module Module aurait des consequence 
encore plus anti-sociales). Lorsque ces fonctions sont appelees, elles s'assurent que le Mo- 
dule en question est charge et elles sont alors remplacees par les appels aux fonctions 
reelles qui viennent d'etre chargees. 

Puisque le pragma autouse deplace des portions de votre programme depuis la compi- 
lation vers l'execution, cela peut avoir des ramifications deplaisantes. Par exemple, si le 
module sur lequel vous avez applique autouse possede une phase d'initialisation qui 
s'attend a etre passee au plus tot, celle-ci pourra ne pas arriver assez tot. L'emploi de 
autouse peut egalement masquer des bogues dans votre code lorsque d'importantes ve- 
rifications sont deplacees de la compilation vers l'execution. 

En particulier, si le prototype que vous avez specifie dans la ligne autouse est faux, vous 
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ne le decouvrirez pas avant que la fonction correspondante soit executee (ce qui peut se 
produire des mois ou des annees plus tard, pour une fonction rarement appelee). Pour 
resoudre partiellement ce probleme, vous pouvez ecrire votre code ainsi durant votre 
phase de developpement : 

use Chasse; 

use autouse Chasse => qw(tolle($) clameur($&)); 

clameur "Cette clameur a ete predeclaree avec autouse\n"; 

La premiere ligne s'assure que les erreurs dans votre specification des arguments soient 
trouvees assez tot. Lorsque votre programme passe de la phase de developpement a la 
phase de production, vous pouvez mettre en commentaire le chargement ordinaire du 
module Chasse et laisser seulement l'appel a autouse. De cette maniere, vous obtenez 
de la securite pendant le developpement et des performances durant la production. 

use base 

use base qw(Mere Pere); 

Ce pragma permet a un programmeur de declarer aisement une classe derivee basee sur 
les classes parentes listees. La declaration ci-dessus est a peu pres equivalente a : 

BEGIN { 

require Mere; 
require Pere; 
push @ISA, qw(Mere Pere) 

} 

Le pragma use base s'occupe de chaque require necessaire. Lorsque vous etes dans la 
portee du pragma strict ' vars J , use base vous laisse faire (effectivement) un assigne- 
ment de @ISA sans avoir a declarer d'abord our @ISA. (Puisque le pragma use base in- 
tervient lors de la compilation, il vaut mieux eviter de titiller @ISA dans votre coin lors 
de l'execution.) 

Mais au-dela de ceci, use base possede une autre propriete. Si l'une des classes de base 
nominees utilise les facilites de use fields decrites plus loin dans ce chapitre, alors le 
pragma initialise les attributs speciaux de champs du paquetage depuis la classe de base. 
(L'heritage multiple des classes de champs n'est pas supporte. Le pragma use base leve 
une exception si plus d'une des classes de base nominees possede des champs.) 

Toute classe de base qui n'a pas encore ete chargee l'est automatiquement via require. 
Toutefois, le fait que Ton doive ou non charger un paquetage d'une classe de base avec 
require est determine, non pas par l'inspection habituelle de %INC, mais par l'absence 
d'une variable globale $VERSI0N dans le paquetage de base. Cette astuce evite a Perl d'es- 
sayer en boucle (et d'echouer) de charger une classe de base qui ne se trouve pas dans le 
fichier que Ton appelle par require (car, par exemple, elle est chargee en tant que fai- 
sant partie du fichier d'un autre module). Si $VERSI0N n'est pas detectee apres avoir 
reussi a charger le fichier, use base definira $VERSI0N dans le paquetage de base, en la 
positionnant a la chaine « -1, defined by base.pm». 
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use blib 

Depuis la ligne de commande : 

% perl -Mblib programme [args...] 

% perl -Mblib=/?FP programme [args...] 

Depuis votre programme Perl : 

use blib; 

use blib 'REP ' ; 

Ce pragma est en premier lieu un moyen de tester arbitrairement les programmes Perl 
pour decouvrir une version non-installee d'un paquetage grace a l'option de la ligne de 
commande de Perl -M. II suppose que la structure de vos repertoires a ete produite par 
le module standard ExtUtils: :MakeMaker. 

Le pragma cherche une structure de repertoire blib commencant depuis un repertoire 
nomme REP (ou le repertoire courant si Ton n'en a specifie aucun) et s'il n'y trouve pas 
de repertoire blib, il revient en arriere a travers vos repertoires « . . », en remontant jus- 
qu'au cinquieme niveau dans les repertoires parents. 

use bytes 

use bytes; 
no bytes; 

Le pragma use bytes desactive la semantique des caracteres pour le reste de la portee 
lexicale dans lequel il apparait. Le pragma no bytes peut etre employe pour inverser les 
effets de use bytes a Finterieur de la portee lexicale courante. 

Perl presume normalement une semantique de caracteres en presence d'une donnee 
sous forme de caracteres (c'est-a-dire, une donnee notee comme etant dans un encodage 
de caractere particulier). 

Pour comprendre les implications et les differences entres les semantiques de caracteres 
et les semantiques d'octets, voir le chapitre 15, Unicode. Une visite a Tokyo peut egale- 
ment etre utile. 

use charnames 

use charnames COMMENT; 

print "\H{SPEC_CAR} est un drole de caractere" ; 

Ce pragma de portee lexicale permet aux caracteres nommes d'etre interpoles vers des 
chames en utilisant la notation \U{SPEC_CAR} : 

use charnames ' :full J ; 

print "\N{GREEK SMALL LETTER SIGMA} est appelee sigma.Nn"; 
use charnames ': short'; 

print "\N{greek:Sigma} est appelee sigma.W; 
use charnames qw(cyrillic greek); 

print "\N{sigma} est sigma en grec et \N{be} est b en cyrillique.Nn"; 



796 



Chapitre 31 — Modules de pragmas 



Le pragma supporte les valeurs :full et : short pour le parametre COMMENT, ainsi que 
des noms de scripts specifiques. 1 L'argument COMMENT determine comment rechercher 
le caractere specifie par SPEC_CAR dans \N{SPEC_CAR}. Si : full est present, SPEC_CAR est 
d'abord cherche dans les tables de caracteres Unicode en tant que nom complet de ca- 
ractere Unicode. Si : short est present et que SPEC_CAR est de la forme 
NOM_SCRIPT: NOM_CAR, NOM_CAR est recherche en tant que lettre dans le script NOM_SCRIPT. 
Si COMMENT contient des noms de scripts specifiques, SPEC_CAR est recherche en tant que 
NOM_CAR dans chacun des scripts donnes et dans Fordre specifie. 

Pour la recherche de NOM_CAR dans un script NOM_SCRIPT donne, le pragma regarde dans 
la table des noms standards Unicode s'il peut trouver des motifs ayant la forme de : 

NOM_SCRIPT CAPITAL LETTER N0M_CAR 
NOM_SCRIPT SMALL LETTER N0M_CAR 
NOM_SCRIPT LETTER N0M_CAR 

Si NOM_CAR est entierement en minuscules (comme dans \N{sigma}), la variante CAPI- 
TAL est ignoree. 

Vous pouvez ecrire votre propre module fonctionnant comme le pragma charnames 
mais definissant differemment les noms de caracteres. Toutefois, l'interface pour cela est 
toujours experimentale, consultez done son etat courant dans la page de man. 



use constant 

use constant TAILLE_TAMPON 

use constant UNE_ANNEE 

use constant PI 

use constant DEBOGAGE 

use constant ORACLE 

use constant NOMUT ILISATEUR 

use constant INFOS UTILISATEUR 



=> 4096; 

=> 365.2425 * 24 * 60 * 60; 
=> 4 * atan2 1, 1; 
=> 0; 

=> ' oracle@cs.indiana.edu''; 
=> scalar getpwuid($<); 
=> getpwuid($<); 



sub deg_rad { PI * $_[o] / 180 } 



print "Cette ligne ne fait rien" unless DEBOGAGE; 

# Les references peuvent etre declarees en tant que constantes 

use constant CHACHAGE => { true => 42 }; 

use constant CTABLEAU => [ 1,2,3,4 ]; 

use constant C_PSEUDO_HACH => [ { true => 1 }, 42]; 

use constant CCODE => sub { "mord $_[o]\n" }; 



print C_HACHAGE->{truc}; 
print C_TABLEAU->{$i]; 
print C_PSEUDO_HACH->{truc}; 



1. Nous ne voulons pas dire par la des scripts Perls. Nous voulons dire des « scripts » comme 
dans certains styles particuliers de lettres ecrites, comme le romain ou le grec ou le cyrillique. 
Malheureusement, « script » est le terme technique pour cela et nous n'avons pas beaucoup de 
chance de persuader le Consortium Unicode d'adopter un terme different. 
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print C_CODE->{"moi"}; 

print C_HACHAGE->[lO]; # erreur a la compilation 

Ce pragma declare le symbole nomine comme etant une constante immuable 2 avec la 
valeur scalaire ou de liste donnee. Vous devez faire une declaration separee pour chaque 
symbole. Les valeurs sont evaluees dans un contexte de liste. Vous pouvez outrepasser 
cela avec scalar comme nous l'avons fait ci-dessus. 

Puisque les constantes ne commencent pas par un $, vous ne pouvez pas les interpoler 
directement dans les chaines entre guillemets, bien que ce soit possible indirectement : 

print "La valeur de PI est @{[ PI ]}.\n"; 

Comme les constantes de liste sont renvoyees en tant que listes, et non en tant que ta- 
bleaux, vous devez indicer une constante representant un valeur de liste en utilisant des 
parentheses supplementaires comme vous le feriez avec toute autre expression de liste : 

$rep_maison = INF0_UTILISATEUR[7] ; # FAUX 
$rep_maison = (INFOJJTILISATEUR) [7] ; # ok 

Bien que Ton recommande d'ecrire les constantes entierement en majuscules pour les 
faire ressortir et pour aider a eviter les collisions potentielles avec d'autres mots-clefs et 
noms de sous-programmes, il ne s'agit que d'une convention. Les noms de constantes 
doivent commencer par une lettre mais celle-ci n'a pas besoin d'etre en majuscule. 

Les constantes ne sont pas privees dans la portee lexicale dans laquelle elles apparais- 
sent. Elle sont plutot de simples sous-programmes sans argument dans la table de sym- 
boles du paquetage oil a lieu la declaration. Vous pouvez vous referez a une constante 
CONS T depuis un paquetage Autre en ecrivant Autre: -.CONST. Approfondissez la notion 
d'insertion en ligne (N.d.T. : Mining) de tels sous-programmes a la compilation en lisant 
la section Substitution en ligne defonctions constantes au chapitre 6. 

Comme dans toutes les directives use, use constant intervient a la compilation. Ainsi, 
placer une declaration de constante a l'interieur d'une instruction conditionnelle com- 
me if ($truc) { use constant ... } est une incomprehension totale. 

Si Ton omet la valeur pour un symbole, ce dernier prendra la valeur undef dans un con- 
texte scalaire ou la liste vide dans un contexte de liste. Mais il vaut probablement mieux 
declarer ceux-ci explicitement : 

use constant CAMELIDE => (); 

use constant MAISON_CHAMEAU => undef; 

Restrictions de use constant 

Les listes constantes ne sont pas actuellement inserees en ligne de la meme maniere que 
les scalaires. Et il n'est pas possible d'avoir un sous-programme ou un mot clef du meme 
nom qu'une constante. C'est probablement une Bonne Chose. 

Vous ne pouvez pas declarer plus d'une constante nommee a la fois : 

use constant TRUC => 4, MACHIN => 5; # FAUX 



2. Implemented comme un sous-programme sans argument et renvoyant toujours la meme 
constante. 
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Ceci defini une constante nommee TRUC qui renvoie une liste (4, "MACHIN" , 5). Vous 
devez plutot ecrire : 

use constant TRUC => 4; 
use constant MACHIN => 5; 

Vous allez au-devant des problemes si vous utilisez une constante dans un contexte qui 
met automatiquement les mots bruts entre guillemets. (Ceci est pas vrai pour tout appel 
de sous-programme, pas seulement pour les constantes.) Par exemple vous ne pouvez 
pas ecrire $hachage{CONSTANTE} car CONSTANTE serait interpretee comme une chame. 
Utilisez %hachage{CONSTANTE ()} ou %hachage{+CONSTANTE} pour empecher le mecanis- 
me de mise entre guillemets de se mettre en branle. De mime, puisque l'operateur => 
met entre guillemets son operande de gauche si cette derniere est un nom brut, vous 
devez ecrire CONS TANTEQ => 'valeur' au lieu de CONSTANTE => 'valeur'. 

Un jour, vous serez capables d'utiliser un attribut constant dans les declarations de va- 
riables : 

my $PI : constant = 4 * atan2(l,l); 

Ceci possede tous les avantages d'etre une variable plutot qu'un sous-programme, mais 
tous les inconvenients de ne pas etre encore implemente. 

use diagnostics 

use diagnostics; # active a la compilation 
use diagnostics -verbose; 

enable diagnostics; # active a l'execution 

disable diagnostics; # desactive a l'execution 

Ce pragma etend les diagnostics ordinaires, laconiques et supprime les avertissements 
dupliques. II augmente les versions abregees avec les descriptions plus explicites et plus 
agreables que Ton peut trouver au chapitre 33, Messages de diagnostic. Comme les autres 
pragmas, celui-ci affecte egalement la phase de compilation de votre programme, pas 
seulement la phase d'execution. 

Lorsque vous utilisez use diagnostics au debut de votre programme, l'option Perl -w 
de la ligne de commande est automatiquement activee en mettant $ A W a 1. La suite de 
votre entiere compilation sera alors sujette a des diagnostics ameliores. Ces derniers sont 
toujours envoyes vers STDERR. 

En raison des interactions entre les resultats d'execution et de compilation, et parce que 
ce n'est souvent pas une tres bonne idee, vous ne devriez pas utiliser no diagnostics 
pour desactiver les diagnostics a la compilation. Vous pouvez neanmoins controler leur 
comportement a l'execution en utilisant les methodes enable et disable, pour respec- 
tivement les activer et les desactiver. (Assurez-vous d'avoir d'abord fait le use ou sinon 
vous serez incapables d'acceder aux methodes.) 

Le flag -verbose affiche d'abord l'introduction de la page man de perldiag avant tout 
autre diagnostic. La variable $diagnostics : : PRETTY peut etre positionnee (avant le 
use) pour generer de meilleures sequences d'echappement pour les pagineurs comme 
/ess(l) ou more{\) : 



use diagnostics 



799 



BEGIN { $diagnostics: : PRETTY = 1 } 
use diagnostics; 

Les avertissements envoyes par Perl et detectes par ce pragma ne sont affiches qu'une 
seule fois chacun. Ceci est utile lorsque vous etes pris dans une boucle qui genere encore 
et toujours le mime avertissement (comme une valeur non-initialisee). Les avertisse- 
ments generes manuellement, comme ceux decoulant des appels a warn ou carp, ne 
sont pas affectes par ce mecanisme de detection des duplications. 

Voici quelques exemples d'utilisation du pragma diagnostics. Le fichier suivant de- 
clenche a coup sur quelques erreurs tant a la compilation qu'a l'execution : 

use diagnostics; 

print NULLE_PART "rien\n"; 

print STDERR "\n\nCe message devrait rester tel quel.Nn"; 
warn "NtAvertissement utilisateur"; 

print "\nTESTEUR DE DIAGNOSTIC : Entrez un <RET0UR_CHARI0T> ici : "; 
my $a, $b = scalar <STDIN>; 
print "\n"; 
print $x/$y; 

ce qui affiche : 

Parenthesis missing around "my" list at diagtest line 6 (#l) 

(W parenthesis) You said something like 

my $foo, $bar = @_; 

when you meant 

my ($foo, $bar) = @_; 

Remember that "my", "our", and "local" bind tighter than comma. 

Name "main: :I\IULLE_PART" used only once: possible typo at diagtest line 2 (#2) 

(W once) Typographical errors often show up as unique variable 
names. If you had a good reason for having a unique name, 
then just mention it again somehow to suppress the message. 
The our declaration is provided for this purpose. 

Name "main::b" used only once: possible typo at diagtest line 6 (#2) 
Name "main::x" used only once: possible typo at diagtest line 8 (#2) 
Name "main::y" used only once: possible typo at diagtest line 8 (#2) 

Filehandle main: :NULLE_PART never opened at diagtest line 2 (#3) 

(W unopened) An I/O operation was attempted on a filehandle that 
was never initialized. You need to do an open() or a socketQ 
call, or call a constructor from the FileHandle package. 

Ce message devrait rester tel quel. 
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Avertissement utilisateur at diagtest line 4. 

TESTEUR DE DIAGNOSTIC : Entrez un <RET0UR_CHARI0T> ICI : 

Use of uninitialized value in division (/) at diagtest line 8 (#4) 

(W uninitialized) An undefined value was used as if it were 

already defined. It was interpreted as a "" or a 0, but maybe 
it was a mistake. To suppress this warning assign a defined 
value to your variables. 

Illegal division by zero at diagtest line 8 (#5) 

(F) You tried to divide a number by 0. Either something was 
wrong in your logic, or you need to put a conditional in to 
guard against meaningless input. 

Uncaught exception from user code: 

Illegal division by zero at diagtest line 8. 

Les messages de diagnostic sont tires du fichier perldiag.pod. Si un gestionnaire 

$SIG{ WARN } existant est detecte, il sera toujours respecte, mais seulement apres que 

la fonction diagnostics : : splainthis (Fintercepteur de $SIG{ WARN } pour le prag- 
ma) aura fait son travail pour vos avertissements. Perl ne supporte pas a l'heure actuelle 
les empilements de gestionnaires, c'est done le mieux que nous puissions faire pour 
l'instant. II existe une variable $diagnostics: : DEBUG que vous pouvez positionner si 
vous etes d'incurables curieux a propos des genres de choses qui sont interceptees. 

BEGIN { $diagnostics: :DEBUG = 1 } 
use diagnostics; 

use fields 

Dans le module Animal : 

package Animal; 
use strict; 

use fields qw(nom poids _Animal_id); 
my $ID = 0; 
sub new { 

my Animal $obj = shift; 

unless (ref $obj) { 

$obj = fields: :new($obj); 

$obj->{_Animal_id} = "ceci est l'ID secret de l'Animal"; 

} 

$obj->{nom} = "He, toi !"; 
$obj->{poids} = 20; 
return $obj; 

} 

i; 

Dans un programme separe, demo_animaI : 
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use Animal; 

my Animal $rock = new Animal; 

$rock->{nom} = "quartz"; 
$rock->{poids} = "2kg"; 
$rock->{_Animal_id} = 1233; 

$rock->{couleur} = "bleu"; 
Dans le module Chien : 



# lexicalement type 



# attribut prive 



# genere une erreur de compilation 



package Chien; 
use strict; 

use base ' Animal'; # herite les champs et methodes d' Animal 

use fields qw(nom pedigree); # surcharge l'attribut nom d'Animal 

# et ajoute un nouvel attribut pedigree 
use fields qw(remue _Chien_prive) # non-partage avec Animal 
sub new { 

my $classe = shift; 

my $obj = fields: :new{$classe}; 

$obj_>SUPER: :new(); # initialise les champs de base 

$obj->{pedigree} = "aucun"; # initialise ses propres champs 
return $obj; 

} 

Dans un programme separe, demo_chien : 
use Chien; 



my Chien $medor = new Chien 
$medor->{nom} = "Theloneus" 
$medor->{poids} = "30lbs"; 
$medor->{pedigree} = "batard" 



# lexicalement type 

# non-herite 

# herite 

# non-herite 



$medor->{couleur} = 'brun'; # genere une erreur de compilation 

$medor->{_Animal_pid} = 3324; # genere une erreur de compilation 

Le pragma fields fournit une methode pour declarer les champs de classe dont le type 
peut etre verifie a la compilation. Ceci repose sur une fonctionnalite connue sous le 
nom de pseudo-hachages : si une variable lexicale typee (my Animal $rock) contient une 
reference (l'objet Animal) et est utilisee pour acceder a un element de hachage ($rock- 
>{nom}), s'il existe un paquetage du meme nom que le type declare, et si ce paquetage a 
positionne des champs de classe en utilisant le pragma fields, alors l'operation se chan- 
ge en acces a un tableau lors de la compilation, pourvu que le champ specifie soit valide. 

Le pragma base apparente combinera les champs des classes de base et ceux declares 
avec le pragma fields. Ceci rend permet a l'heritage de champ de bien fonctionner. 

Les noms de champ qui commencent par un caractere souligne sont rendus prives pour 
la classe et invisibles dans les sous-classes. Les champs herites peuvent etre surcharges 
mais genereront un avertissement si les avertissements sont actives. 

La consequence de tout ceci est que vous pouvez avoir des objets avec des champs nom- 
mes qui soient aussi compacts que des tableaux avec un acces aussi rapide. Cependant, 
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ceci ne fonctionne que tant que Ton accede aux objets a travers des variables convena- 
blement typees. Si les variables ne sont pas typees, Faeces est uniquement verifie a l'exe- 
cution, votre programme tourne done plus lentement car il doit acceder a la fois a un 
hachage et a un tableau. En plus des declarations de champs, les fonctions suivantes sont 
supportees : 

new 

La fonction fields : : new cree et consacre un pseudo-hachage dans la classe speci- 
fied (qui peut egalement etre specifiee en passant un objet de cette classe). L'objet 
est cree avec les champs declares auparavant pour cette classe avec le pragma 
fields. Ceci autorise l'ecriture d'un constructeur comme ceci : 

package Creature: :Sons; 

use fields qw(chat chien oiseau); 

sub new { 

my Creature: Sons $obj = shift; 

$obj = fields: :new($obj) unless ref $obj; 

$obj->{chat} = 'miaule'; # element scalaire 

@$obj{'chien', 'oiseau'} = ('aboie'/siffle'); # tranche 
return $obj; 

} 

phash 

La fonction fields: : phash cree et initialise un pseudo-hachage brut (non-consa- 
cre). Vous devriez toujours utiliser cette fonction pour creer des pseudo-hachages 
au lieu de le faire directement, au cas ou nous decidions de changer l'implementa- 
tion. 

Si le premier argument de phash est une reference a un tableau, le pseudo-hachage sera 
cree avec des clefs provenant de ce tableau. Si le second argument est fourni, ce doit etre 
egalement une reference a un tableau dont les elements seront utilises comme valeurs. 
Si le second tableau contient moins d'elements que le premier, les elements restants du 
pseudo-hachage ne seront pas initialises. Ceci est particulierement utile pour creer un 
pseudo-hachage a partir des arguments d'un sous-programme : 

sub chien_option { 

my $option = fields: :phash([qw(nom grade matricule)], [@_]); 

} 

Vous pouvez aussi passer une liste de paires clef/valeur qui sera utilisee pour construire 
le pseudo-hachage : 

my $option = fields :: phash(nom => "Doe", 

grade => "capitaine", 
matricule => 42); 

my $pseudo_hachage = fields: :phash(%args); 

Pour plus d'information sur les pseudo-hachages, voir la section « Pseudo-hachages » 
au chapitre 8, References. 

^implementation actuelle conserve les champs declares dans le hachage %FIE LDS du pa- 
quetage appelant, mais cela peut changer dans les prochaines versions, il vaut done 
mieux vous fier a l'interface de ce pragma pour gerer vos champs. 
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use filetest 

$lecture_peut_etre_possible = -r "fichier" # utilise les bits de mode 
{ 

use filetest 'access'; 

$lecture_vraiment_possible = -r "fichier" # depiste plus serieusement 

} 

$lecture_peut_etre_possible = -r "fichier'; # utilise a nouveau les 

#bits de mode 

Ce pragma de portee lexicale indique au compilateur de changer le comportement des 
operateurs unaires de test de fichier -r, -w, -x, -R, -W et -X, documentes au chapitre 3, 
Operateurs unaires et binaires. Le comportement par defaut de ces tests de fichiers est 
d'utiliser les bits de mode renvoyes par les appels de la famille de stat. Toutefois, ce n'est 
peut-etre pas toujours la facon correcte de faire, comme lorsqu'un systeme de fichiers 
comprends les ACL (Access Control Lists, listes de controle d'acces). Dans les environne- 
ment ou cela compte, comme AFS, le pragma use filetest peut aider les operateurs 
de permissions a renvoyer des resultats plus coherents avec d'autres outils. 

II peut y avoir une legere baisse de performance pour les operateurs de test de fichier 
affectes lorsqu'on les utilise avec use filetest, car sur certains systemes les fonctionna- 
lites etendues ont besoin d'etre emulees. 

Attention : toute notion d'utilisation de tests de fichiers dans des objectifs de securite 
est une cause perdue d'avance. La porte est grande ouverte pour des situations de con- 
currence (race conditions), car il n'y a aucun moyen de garantir que les permissions ne 
changeront pas entre le test et Foperation effective. Si vous etes ne serait-ce qu'un peu 
serieux avec la securite, vous n'utiliserez pas d'operateurs de test de fichier pour decider 
si quelque chose va marcher ou pas. A la place, essayez de lancer Foperation reelle puis 
testez si Foperation a reussi ou non. (Vous devriez de toute facon faire cela.) Voir la sec- 
tion Gestion des probVemes de synchronisation au chapitre 23, Securite. 

use filetest 'access' 

Actuellement une seule importation, access, est implementee. Lappel de use file- 
test 'access' active Femploi d , access(2) ou d'appels systemes equivalents lorsqu'on 
lance des tests de fichier ; symetriquement, no filetest 'access' le desactive. Cette 
fonctionnalite etendue de test de fichier n'est utilisee que lorsque Foperande de Fopera- 
teur (ou, si vous preferez, Fargument de la fonction unaire) est un veritable nom de fi- 
chier, et non un handle de fichier. 

use integer 

use integer; 
$x = 10 / 3; 

# $x vaut maintenant 3, et non 3.33333333333333333 

Ce pragma de portee lexicale indique au compilateur d'utiliser des operations entieres 
a partir de ce point et jusqu'a la fin du bloc Fencadrant. Sur la plupart des machines, 
cela infuence peu la majorite des calculs mais sur celles qui ne disposent pas de copro- 
cesseur arithmetique, cela peut entramer une difference de performance dramatique. 
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Remarquez que ce pragma affecte certaines operations numeriques, pas les nombres 
eux-meme. Par exemple, si vous lancez ce code : 

use integer; 
$x = 1.8; 
$y = $x + l; 
$z = -1.8; 

vous vous retrouverez avec $x == 1.8, $y == 2et$z == -1. Le cas de $z s'explique par 
le fait qu'un - unaire compte comme une operation, ainsi la valeur 1 . 8 est tronquee a 
un avant que son bit de signe soit inverse. De meme, les fonctions qui attendent des 
nombres a virgule flottante, comme sqrt ou les fonctions trigonometriques, recevront 
et renverront toujours des nombres a virgule meme sous use integer. Ainsi 
sqrt(l.44) vaut 1.2 mais 0 + sqrt(l.44) vaut maintenant seulement 1. 

L'arithmetique entiere native, telle qu'elle est fournie par votre compilateur C, est utili- 
see. Cela signifie que la propre semantique de Perl pour les operations arithmetiques 
peut ne pas etre preservee. Une source d'ennuis frequente est le modulo des nombres 
negatifs. Perl le calcule d'une facon mais votre materiel peut le faire d'une autre manie- 
re : 

% perl -le 'print (4 % -3)' 

-2 

% perl -Minteger -le 'print (4 % -3)' 

1 

use less 

use less; # AUCUN N'EST IMPLEMENTS 

use less 'CPU'; 

use less 'memory'; 

use less 'time'; 

use less 'disk'; 

use less 'fat'; # geant avec "use locale"; 

Actuellement non-implemente, ce pragma est destine a donner un jour des indications 
au compilateur, au generateur de code ou a Finterpreteur pour activer certains equili- 
brages. 

II n'y a aucun mal a demander a utiliser moins (use less) de quelque chose alors que Perl 
ne sait pas comment reduire ce quelque chose a l'heure actuelle. 

use lib 

use lib "$ENV{HOME}/libperl"; # ajoute ~/libperl 
no lib "."; # enleve cwd 

Ce pragma simplifie la manipulation de @INC a la compilation. II est generalement uti- 
lise pour ajouter des repertoires supplementaires dans le chemin de recherche de Perl 
pour qu'ensuite les instructions do, require et use trouvent les fichiers de bibliotheque 
qui ne se situent pas dans le chemin de recherche par defaut de Perl. II est particuliere- 
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ment important avec use, puisque ce dernier intervient egalement a la compilation et 
que Paffectation ordinaire de @INC (c'est-a-dire a l'execution) arriverait trop tard. 

Les parametres de use lib sont ajoutes au debut du chemin de recherche de Perl. Ecrire 
use lib LISTE revient a peupres au meme qu'ecrire BEGIN { unshift(@INC, LISTE) }, 
mais use lib i. IS TE inclut le support des repertoires specif iques a une plate-forme. Pour 
chaque repertoire $rep donne dans sa liste d'arguments, le pragma list verifie egale- 
ment si un repertoire nomme $rep/$nom_architecture/auto existe ou non. Si c'est le cas, 
le repertoire $rep/$nom_architecture/auto est suppose correspondre a un repertoire spe- 
cifique a la plate-forme et il est done ajoute a @INC (devant $rep). 

Pour eviter les ajouts redondants qui ralentissent les temps d'acces et gaspillent une pe- 
tite quantite de memoire, les entrees dupliquees qui restent dans @INC sont supprimees 
lorsque des entrees sont ajoutees. 

Normalement, vous ne devez qu'ajouter des repertoires dans @INC. Si vous avez vraiment 
besoin d'enlever des repertoires de @INC, prenez garde a ne supprimer que ceux que 
vous avez vous-meme ajoutes ou ceux dont vous etes certains qu'ils ne sont pas necessai- 
res a d'autres modules dans votre programme. D'autres modules peuvent avoir ajoute 
dans votre tableau @>INC des repertoires dont ils avaient besoin pour que leurs opera- 
tions soient correctement effectuees. 

Le pragma no lib supprime de @INC toutes les instances de chaque repertoire nomme. 
II detruit egalement tous les repertoires correspondants specifiques a la plate-forme, tels 
que nous les avons decrits plus haut. 

Lorsque le pragma lib est charge, il sauvegarde la valeur courante de @INC dans le ta- 
bleau @lib: :0RIG_II\IC, afin de copier ce tableau dans le veritable @INC pour restaurer la 
valeur originale. 

Meme si @INC inclut generalement le repertoire courant, point (« . »), Ce n'est vrai- 
ment pas aussi utile que vous pouvez le penser. Premierement, Fentree point vient a la 
fin, pas au debut. Ainsi les modules installed dans le repertoire courant ne prennent pas 
soudainement le dessus sur les versions globales au systeme. Vous pouvez ecrire use lib 
" . " si c'est ce que vous voulez vraiment. Plus ennuyeux, il s'agit du repertoire courant 
du processus Perl, et non du repertoire ou le script a ete installe, ce qui enleve toute fia- 
bilite a cet ajout de « . ». Si vous creez un programme, plus quelques modules utilises 
par ce programme, il marchera tant que vous developpez, mais cela cessera lorsque vous 
ne le lancerez pas depuis le repertoire ou se trouvent les fichiers. 

Une solution pour cela est d'utiliser le module standard FindBin : 

use FindBin; # ou le script a-t-il ete installe ? 

use lib $FindBin: :Bin; # utilise egalement ce repertoire pour lib 

Le module FindBin essaie de deviner le chemin complet vers le repertoire oil a ete ins- 
talle le programme du processus en train de tourner. N'utilisez pas ceci dans des objec- 
tifs de securite car les programmes malveillants peuvent d'ordinaire le detourner en 
essayant suffisamment energiquement. Mais a moins que vous n'essayez intentionnel- 
lement de casser le module, il devrait marcher comme prevu. Le module procure une 
variable $Findbin: :Bin (que vous pouvez importer) qui contient l'emplacement oil le 
programme a ete installe, tel que le module Fa devine. Vous pouvez alors utiliser le prag- 
ma lib pour ajouter ce repertoire a votre tableau @INC, produisant ainsi un chemin re- 
latif a Fexecutable. 
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Certains programmes s'attendent a etre installes dans un repertoire bin et trouvent alors 
leurs modules de bibliotheque dans les fichiers « cousins » installes dans un repertoire 
lib au mime niveau que bin. Par exemple, des programmes peuvent se trouver dans /usr/ 
local/apache/bin ou /opt/perl/bin et les bibliotheques dans /usr/local/ap ache/lib et/opt/perl/ 
lib. Ce code en tient soigneusement compte : 

use FindBin qw(Bin); 
use lib "$Bin/../lib"; 

Si vous vous retrouvez a specifier le meme use lib dans plusieurs programmes sans rap- 
port les uns avec les autres, vous pouvez envisager de positionner a la place la variable 
d'environnement PERL5LIB. Voir la description de la variable d'environnement 
PERL5LIB au chapitre 19, L'interface de la ligne de commande. 

# syrrtaxe pour sh, bash, ksh ou zsh 

$ PERLLIB=$HOME/libperl; export PERL5LIB 

# syntaxe pour csh ou tcsh 
$ setenv PERL5LIB "Vlibperl 

Si vous voulez utiliser des repertoires optionnels uniquement pour ce programme sans 
changer son code source, regardez du cote de l'option de la ligne de commande -I : 

% perl -I "Vlibperl chemin-programme args 

Voir le chapitre 19 pour plus d'informations sur l'emploi de -I dans la ligne de com- 
mande. 

use locale 

(Six = sort @y; # tri dans l'ordre ASCII 
{ 

use locale; 

@x = sort @y; # tri dans l'ordre defini par les locales 

} 

(5)x = sort @y; # a nouveau tri dans l'ordre ASCII 

Ce pragma de portee lexicale indique au compilateur d'activer (ou de desactiver, avec no 
locale) l'emploi des locales POSIX pour les operations intrinseques. L'activation des lo- 
cales indique aux fonctions de conversions de casse (majuscule/minuscule) de Perl et au 
moteur de recherche de motifs de respecter l'environnement de votre langue, en auto- 
risant les signes diacritiques 3 , etc. Si ce pragma est actif et que votre bibliotheque C con- 
nait les locales POSIX, Perl recherche la valeur de votre variable d'environnement 
LC_CTYPE pour les expressions regulieres et LC_COLLATE pour les comparaisons de chai- 
nes comme celles de sort. 

Comme les locales sont plus une forme de nationalisation que d'internationalisation, 
l'emploi des locales peut interferer avec Unicode. Voir le chapitre 15 pour plus d'infor- 
mations sur l'intemationalisation. 



3. N.d.T. : signe qui donne a un caractere de l'alphabet une valeur speciale. 
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use open 

use open IN => ":crlf", OUT => ":raw"; 

Le pragma open declare une ou plusieurs disciplines par defaut pour les operations d'en- 
trees/sorties. Chaque operateur open et readpipe (c'est-a-dire qx/7 ou les apostrophes in- 
verses) decouvert a l'interieur de la portee lexicale de ce pragma et qui ne specifie pas 
ses propres disciplines utilisera celles declarees par defaut. Ni open avec un ensemble ex- 
plicite de disciplines, ni sysopen en toute circonstance, ne sont influences par ce prag- 
ma. 

Seules les deux disciplines : raw et : crlf sont actuellement implementees (cependant 
au moment oil nous ecrivons cela, nous esperons qu'une discipline : utf 8 le soit egale- 
ment bientot). Sur les systemes ancestraux qui font la distinction entre ces deux modes 
de conversions lors de l'ouverture de fichiers, la discipline : raw correspond au « mode 
binaire » et :crlf au « mode texte ». (Ces deux disciplines n'ont actuellement aucun 
effet sur les plates-formes oil binmode n'en a pas non plus, mais seulement pour le 
moment ; voir la fonction open au chapitre 29, Fonctions, pour une description plus de- 
taillee des semantiques que nous esperons en ce qui concerne les diverses disciplines.) 

Le support exhaustif des disciplines d'entrees/sorties n'est pas encore implemente a ce 
jour. Lorsqu'elles seront enfin supportees, ce pragma servira comme l'une des interfaces 
pour declarer les disciplines par defaut pour toutes les entrees/sorties. A ce moment-la, 
les disciplines par defaut declarees avec ce pragma seront accessibles par le biais de la 
discipline speciale nommee « :DEFAULT » et exploitables a l'interieur des constructeurs 
de handles qui autorisent la specification de disciplines. Cela rendra possible l'empile- 
ment de nouvelles disciplines par-dessus celles par defaut. 

open (HF, "<:para :DEFAULT", $fichier) 

or die "impossible d'ouvrir $fichier : $!"; 

Lorsqu'il sera complet, le support des disciplines d'entrees/sorties permettra a toutes les 
disciplines supportees de fonctionner sur toutes les plates-formes. 

use overload 

Dans le module Nombre : 
package Nombre; 

use overload "+" => \&mon_addition"; 

"-" => \&ma_soustraction"; 
"*=" => \&mon_produit_par"; 

Dans votre programme : 

use Nombre; 

$a = new Nombre 57; 

$b = $a +5; 

Les operateurs internes fonctionnent bien avec des chames et des nombres mais n'ont 
que peu de sens lorsqu'on les applique a des references d'objets (puisque, contrairement 
a C ou a C++, Perl ne permet pas de faire de l'arithmetique de pointeur). Le pragma 
overload vous laisse redefinir les significations de ces operations internes lorsque vous 
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les appliquez a des objets de votre cm. Dans l'exemple precedent, l'appel au pragma re- 
definit trois operation sur des objets Nombre : l'addition appellera la fonction Nom- 
bre: :mon_addition, la soustraction appellera la fonction Nombre: :ma_soustraction et 
l'operateur d'assignement accompagne d'une multiplication appellera la methode 
mon_produit_par de la classe Nombre (ou de l'une de ses classes de base). Nous disons 
que ces operateurs sont surcharges (overloaded) car des significations supplementaires les 
recouvrent (et non parce qu'ils ont trop de significations - quoique cela peut egalement 
etre le cas). 

Pour plus d'informations sur la surcharge, voir le chapitre 13, Surcharge. 



use re 

Ce pragma controle Futilisation des expressions regulieres. On peut Finvoquer de qua- 
tre facons : " taint " et " eval ", qui ont une portee lexicale, plus " debug " et " debu- 
gcolor " qui n'en ont pas. 

use re 'taint'; 

# Le contenu de $corresp est marque si $gribouille etait aussi marque. 
($corresp) = ($gribouille =~ /(.*)$/s); 

# Permet 1' interpolation de code : 
use re 'eval'; 

$motif = '(?{ $var = 1 })'; # execution de code insere 
/alpha${motif}omega/; # n'echouera pas a moins d'etre lance 

# avec -T et que $motif soit marque 

use re 'debug'; # comme "perl -Dr" 

/ A (.*)$/s; # affichage d'informations de debogage 

# durant la compilation et l'execution 

use re 'debugcolor' # comme 'debug' , mais avec un affichage 

# en couleur 

Lorsque use re 'taint' est actif et qu'une chaine marquee est la cible de l'expression 
reguliere, les variables numerotees de l'expression reguliere et les valeurs renvoyes par 
l'operateur m// dans un contexte de liste sont egalement marquees. Ceci est tres utile 
lorsque les operations d'expressions regulieres sur des donnees marquees ne sont pas 
vouees a extraire des sous-chames securisees mais a effectuer d'autres transformations. 
Voir la discussion sur le marquage au chapitre 23. 

Lorsque use re 'eval' est actif, une expression reguliere a le droit de contenir des as- 
sertions executant du code Perl, qui sont de la forme (?{...}), meme si l'expression re- 
guliere contient des variables interpolees. L'execution des segments de code resultant de 
l'interpolation de variables a l'interieur des expressions regulieres n'est pas habituelle- 
ment permise pour des raisons de securite : vous ne voulez pas que des programmes qui 
lisent des motifs depuis des fichiers de configuration, des arguments de la ligne de com- 
mande ou des champs de formulaires CGI, se mettent subitement a executer un code 
arbitraire s'ils ne sont pas concus pour s'attendre a cela. Cet emploi du pragma permet 
uniquement aux chaines non-marquees d'etre interpolees ; les donnees marquees cau- 
seront toujours la levee d'une exception (si vous activez la verification des marquages). 
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Voir egalement le chapitre 5, Correspondance de motifs et le chapitre 23. 

A l'intention de ce pragma, l'interpolation d'expressions regulieres precompilees (pro- 
duites par l'operateur qr/7) n'est pas consideree comme une interpolation de variable. 
Neanmoins, lorsque vous construisez le motif qr//, use re 'eval' doit etre actif si 
l'une de ses chaines interpolees contient des assertions de code. Par exemple : 

$code = '(?{ $n++ })'; # assertion de code 

$chaine = '\b\w+\b' . $code; # construit la chaine a interpoler 

$ligne =~ /$chaine/; # ceci a besoin de use re 'eval' 

$motif = qr/$chaine/; # ceci egalement 

$ligne =~ /$motif/; # mais pas ceci 

Avec use re 'debug', Perl emet des message de debogage a la compilation et a l'execu- 
tion d'expressions regulieres. L'affichage est identique a celui obtenu en lancant un 
« debogueur Perl » (Fun de ceux compiles en passant -DDEBUCCINC au compilateur C) 
et en executant alors votre programme Perl avec l'option de la ligne de commande de 
Perl -Dr. Selon la complexite de votre motif, l'affichage resultant peut vous noyer. L'ap- 
pel de use re 'debugcolor' permet un affichage plus colore qui peut s'averer utile, 
pourvu que votre terminal comprenne les sequences de couleurs. Positionner votre va- 
riable d'environnement PERL_RE_TC avec une liste de proprietes termcap(5) pertinentes, 
separees par des virgules, pour faire ressortir l'affichage. Pour plus de details, voir le cha- 
pitre 20, Le detogueur Perl. 
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use sigtrap; 

use sigtrap qw(stack-trace old-interface-signals); # idem 

use sigtrap qw(BUS SECV PIPE ABRT); 

use sigtrap qw(die INT QUIT); 

use sigtrap qw(die normal-signals); 

use sigtrap qw(die untrapped normal-signals); 

use sigtrap qw(die untrapped normal-signals stack-trace any error-signals); 

Le pragma sigtrap installe pour vous quelques gestionnaires de signaux simples pour 
vous eviter de vous en inquieter. Ceci est tres utile dans les situations ou les signaux non- 
interceptes causeraient des dysfonctionnement dans votre programme; comme lorsque 
vous avez des blocs END {}, des destructeurs d'objets ou d'autres traitements a lancer a 
la fin de votre programme quelle que soit la facon dont il se termine. 

Le pragma sigtrap fournit deux gestionnaires de signaux simples que vous pouvez uti- 
liser. L'un apporte a Perl une trace de la pile et l'autre lance une exception ordinaire via 
die. Vous pouvez aussi fournir votre propre gestionnaire au pragma pour qu'il l'installe. 
Vous pouvez specifier des ensembles de signaux predefinis a intercepter ; vous pouvez 
egalement donner votre propre liste explicite de signaux. Le pragma peut optionnelle- 
ment installer des gestionnaires uniquement pour les signaux qui n'auraient sinon pas 
ete geres. 

Les arguments passes a use sigtrap sont traites dans l'ordre. Lorsqu'un nom de signal 
fourni par l'utilisateur ou le nom d'un des ensembles de signaux predefinis de sigtrap 
est rencontre, un gestionnaire est immediatement installe. Lorsqu'il y a une option, cel- 
le-ci n'affecte que les gestionnaires installes ensuite en traitant la liste d'arguments. 
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Gestionnaires de signaux 

Ces options ont pour effet de decider quel gestionnaire sera utilise pour les signaux ins- 
talled ensuite : 

stack-trace 

Ce gestionnaire fourni par le pragma affiche une trace de la pile d'execution Perl 
vers STDERR et tente alors de faire une copie du cceur du programme (core dump). II 
s'agit du gestionnaire de signaux par defaut. 

die 

Ce gestionnaire fourni par le pragma appelle die via Carp: : croak avec un message 
indiquant le signal recu. 

handler VOTRE_GES TIONNA IRE 

VOTRE_CESTIONNAIRE sera utilise comme gestionnaire pour les signaux installed 
ensuite. VOTRE_CESTIONNAIRE peut etre n'importe quelle valeur valide pour un assi- 
gnement de %SIG. Souvenez-vous que le fonctionnement correct de beaucoup 
d'appels de la bibliotheque C (en particulier les appels d'entrees/sorties standards) 
n'est pas garanti a l'interieur d'un gestionnaire de signaux. Pis encore, il est difficile 
de deviner quels morceaux du code de la bibliotheque C sont appeles depuis tel ou 
tel morceau du code Perl. (D'un autre cote, nombre de signaux que sigtrap inter- 
cepte sont un peu vicieux — ils vous feront tourner en bourrique de toute facon, 
alors ca ne coute pas grand chose d'essayer de faire quelque chose, n'est-ce pas?) 

Listes predefinies de signaux 

Le pragma sigtrap inclut quelques listes predefinies de signaux a intercepter : 
normal-signals 

II s'agit des signaux qu'un programme peut normalement s'attendre a rencontrer et 
qui le font, par defaut, se terminer. Ce sont les signaux HUP, INT, PIPE et TERM. 

error-signals 

II s'agit des signaux qui d'ordinaire indiquent un serieux probleme avec Finterpre- 
teur Perl ou avec votre programme. Ce sont les signaux ABRT, BUS, EMT, FPE, KILL, 
QUIT, SECy SYS et TRAP. 

old-interface- signals 

II s'agit des signaux qui sont interceptes par defaut sous une ancienne version de 
l'interface de sigtrap. Ce sont les signaux ABRT, BUS, EMT, FPE, KILL, PIPE, QUIT, SECV 
SYS, TERM et TRAP. Si aucun signal ou aucune liste de signaux n'est passe a use sig- 
trap, on utilise cette liste. 

Si votre plate-forme n'implemente pas un signal particulier cite dans les listes predefi- 
nies, le nom de ce signal sera discretement ignore. (Le signal lui-meme ne peut pas etre 
ignore car il n'existe pas.) 
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Autres arguments de sigtrap 
untrapped 

Ce token supprime les gestionnaires pour tous les signaux listes ulterieurement s'ils 
ont deja ete interceptes ou ignores. 

any 

Ce token installe des gestionnaires pour tous les signaux listes ulterieurement. II 
s'agit du comportement par defaut. 

signal 

Tout argument qui ressemble a un nom de signal (c'est-a-dire qui correspond au 
motif / A [A-Z] [A-Z0-9]*$/ enjoint a sigtrap de gerer ce signal. 

nombre 

Un argument numerique requiert que le numero de version du pragma sigtrap 
soit au moins nombre. Ceci fonctionne exactement comme la plupart des modules 
ordinaires qui ont une variable de paquetage $VERSI0N. 

% perl -Msigtrap -le 'print $sigtrap: :VERSI0I\T 

1.02 

Exemples de sigtrap 

Fournit une trace de la pile pour les signaux utilisant l'ancienne interface : 

use sigtrap; 
Idem, mais plus explicite : 

use sigtrap qw(stack-trace old-interface-signals); 
Fournit une trace de la pile uniquement pour les quatre signaux listes : 

use sigtrap qw(BUS SEGV PIPE ABRT); 
Meurt (via die) sur reception du signal INT ou QUIT : 

use sigtrap qw(die INT QUIT); 
Meurt (via die) sur reception de l'un des signaux HUP, INT, PIPE ou TERM : 

use sigtrap qw(die normal-signals); 

Meurt (via die) sur reception de HUP, INT, PIPE ou TERM — a cela pres qu'on ne change 
pas le comportement pour les signaux qui ont deja ete interceptes ou ignores ailleurs 
dans le programme : 

use sigtrap qw(die untrapped normal-signals); 

Meurt (via die) sur reception de n'importe quel signal « normal-signals » non-inter- 
cepte actuellement ; de plus, fournit une trace arriere de la pile d'execution sur recep- 
tion de l'un des signaux « error-signals » : 

use sigtrap qw(die untrapped normal-signals stack-trace any error-signals); 

Installe la routine mon_gestionnaire comme gestionnaire pour les signaux « normal- 
signals » : 

use sigtrap 'handler' => \&mon_gestionnaire, 'normal-signals'; 



812 



Chapitre 31 — Modules de pragmas 



Installe la routine mon_gestionnaire comme gestionnaire pour les signaux « normal- 
signals » ; de plus, fournit une trace arriere de la pile d'execution sur reception de Fun 
des signaux « error-signals » : 

use sigtrap qw(handler mon_gestionnaire normal-signals stack-trace 
error-signals); 

use strict 

use strict; # Installe les trois restrictions. 

use strict "vars"; # Les variables doivent etre predeclarees. 

use strict "refs"; # Les references symboliques sont interdites. 

use strict "subs"; # Les chaines brutes doivent etre entre guillemets. 

use strict; # Installe toutes les restrictions 

no strict "vars"; # puis renonce a l'une d'entre elles. 

Ce pragma de portee lexicale modifie quelques regies basiques a propos de ce que Perl 
considere comme etant du code legal. Quelquefois, ces restrictions semblent trop stric- 
tes pour de la programmation occasionnelle, comme lorsque vous ne faites qu'essayer 
de programmer a la hate un filtre de cinq lignes. Plus votre programme est gros, plus 
vous devez etre strict avec lui. 

Actuellement, vous devez etre strict avec trois choses : subs, vars et refs. Si aucune liste 
d'importation n'est fournie, les trois restrictions sont prises en compte. 

strict 'refs' 

Cet exemple genere une erreur a l'execution si vous utilisez des references symboliques, 
intentionnellement ou pas. Voir le chapitre 8, References pour plus d'informations. 

use strict 'refs'; 

$ref = \$truc; # Enregistre une reference "reelle" (en dur). 
print $$ref; # Dereferencement ok. 

$ref = "true"; # Enregistre le nom d'une variable globale (de paquetage). 
print $$ref; # FAUX, erreur a l'execution avec strict refs. 

Les references symboliques sont suspectes pour diverses raisons. II est etonnamment 
aise, meme pour des programmeurs bien intentionnes, de les invoquer accidentelle- 
ment ; strict ' refs ' l'empeche. Au contraire des references reelles, les references sym- 
boliques ne peuvent se referer qu'a des variables globales. Elles ne possedent pas de 
compteur de references. II existe souvent un meilleur moyen d'accomplir ce que vous 
faites : au lieu de referencer un symbole dans une table de symboles globale, utilisez un 
hachage pour sa propre mini-table de symboles. C'est plus efficace, plus lisible et moins 
sujet a engendrer des erreurs. 

Neanmoins, certains types de manipulations valides necessitent vraiment un acces di- 
rect a la table de symboles globale du paquetage pour les noms de variables et de func- 
tions. Par exemple, il se peut que vous vouliez examiner la liste ^EXPORT de la super- 
classe @ISA d'un paquetage donne dont vous ne connaissez pas le nom a l'avance. Ou 
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vous pourriez vouloir installer toute une kyrielle d'appels de fonctions qui seraient tou- 
tes des alias de la mime fermeture. C'est seulement la que les references symboliques 
sont les plus utiles, mais pour les utiliser alors que use strict est actif, vous devez 
d'abord annuler la restriction " ref " : 

# construit un groupe cPaccesseurs pour les attributs for my $nom_meth (qw/ 
nom grade matricule/) { 
no strict 'rets'; 

*$nom_meth = sub { $_[o]->{ _PACKACE_ . $nom_meth }; 

strict 'vars' 

Dans cette restriction, une erreur de compilation est declenchee si vous essayez d'acce- 
der a une variable qui n'est pas conforme a au moins un de ces criteres : 

• Predefinie par Perl, comme @ARCV %ENV et toutes les variables globales avec des 
signes de ponctuation comme $ . ou $_. 

• Declaree avec our (pour une variable globale) ou my (pour une variable lexicale). 

• Importee depuis un autre paquetage. (Le pragma use vars simule une importa- 
tion, mais utilisez our a la place.) 

• Pleinement qualifiee en utilisant le nom de son paquetage et le double deux-points 
separateur de paquetage. 

L'emploi seul d'un operateur local n'est pas suffisant pour rendre heureux use strict 
'vars' car, malgre son nom, cet operateur ne change pas le fait qu'une variable nom- 
inee soit globale ou non. II donne seulement a la variable une nouvelle valeur tempo- 
raire durant un bloc lors de l'execution. Vous devrez toujours employer our pour 
declarer une variable globale ou my pour declarer une variable lexicale. Vous pouvez 
toutefois localiser un our : 

local our $loi = "martiale"; 

Les variables globales predefinies par Perl sont dispensees de ces exigences. Ceci s'appli- 
que aux variables globales de tout le programme (celles forcees dans le paquetage main 
comme @ARGV ou $_) et aux variables par paquetage comme $a ou $b, qui sont norma- 
lement utilisee par la fonction sort. Les variables par paquetage utilisees par les modu- 
les comme Exporter ont toujours besoin d'etre declarees en utilisant our : 

our @EXPuRT_0K = qw(nom grade matricule); 

strict 'subs' 

Cette restriction oblige Perl a traiter les mots simples comme des erreurs de syntaxe. Un 
mot simple (bareword ou bearword dans certains dialectes) est un nom simple ou un iden- 
tificateur qui n'a aucune autre interpretation forcee par le contexte. (Le contexte est sou- 
vent force par la proximite d'un mot clef ou d'un token ou par la predeclaration du mot 
en question.) Historiquement, les mots simples etaient interpretes comme des chaines 
sans guillemets ou apostrophes. Cette restriction rend cette interpretation illegale. Si 
vous avez l'intention de l'utiliser en tant que chaine, mettez-la entre guillemets ou entre 
apostrophes. Si vous avez l'intention de l'utiliser en tant que fonction, predeclarez-la ou 
employez des parentheses. 
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Comme cas particulier de contexte force, souvenez-vous qu'un mot qui apparait entre 
des accolades ou du cote gauche de l'operateur => compte comme s'il etait entre apos- 
trophes et n'est done pas sujet a cette restriction. 

use strict 'subs'; 



$x = n_importe_quoi; 
$x = n_importe_quoi(); 



# FAUX : erreur de mot simple ! 

# Par contre, cela marche tou jours. 



sub n_importe_quoi; 
$x = n_importe_quoi; 



# Predeclaration de fonction. 

# Maintenant ok. 



# Ces utilisations sont permises car => met entre apostrophes 
%hachage = (rouge => 1, vert => 2, bleu => 3); 



$num_rouge = $hachage{rouge}; 



# Ok, les accolades mettent entre 

# apostrophes ici. 



# Mais pas celles-ci : 

@nums = @hachage{bleu, vert}; 

@nums * @hachage{"bleu", "vert"}; 

loinums = @hachage{qw/bleu vert/}; 



# Faux : erreur de mot simple. 

# Ok, les mots sont maintenant entre 

# guillemets. 

# Idem. 



use subs 

use subs qw/am stram gram/; 

@x = am 3. .10; 

(Six = gram stram @x; 

Ce pragma predeclare tous les noms de la liste d'arguments comme etant des sous-pro- 
grammes standards. L'avantage ici est que vous pouvez maintenant utiliser ces fonctions 
sans parentheses en tant qu'operateurs de listes, exactement comme si vous les aviez de- 
clarers vous-memes. Ce n'est pas forcement aussi utile que des declarations completes 
car cela ne permet pas d'utiliser des prototypes ou des attributs comme dans : 

sub am(@); 

sub stram(\@) : locked; 
sub gram($) : lvalue; 

Puisqu'il est base sur le mecanisme d'importation standard, le pragma use subs n'a pas 
de portee lexicale mais une portee de paquetage. C'est-a-dire que les declarations sont 
effectives pour la totalite du fichier dans lequel elles apparaissent, mais seulement pour 
le paquetage courant. Vous ne pouvez pas annuler de telles declarations avec no subs. 



use vars 

use vars qw($bricole @refait %vu); 

Ce pragma, autrefois utilise pour declarer une variable globale, est maintenant quelque 
peu deprecie en faveur du modificateur our. La declaration precedente s'effectue mieux 
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en utilisant : 

our($bricole, @refait, %vu}; 

ou meme : 

our $bricole = "F"; 

our @refait = "A" . . $bricole; 

our %vu = (); 

Peu importe que vous utilisiez Fune ou l'autre de ces possibilites, rappelez-vous qu'elles 
portent toutes sur des variables globales de paquetage, et non sur des variables lexicales 
ayant la portee du fichier. 

use warnings 

use warnings; # Revient a importer "all". 

no warnings; # Revient a annuler l' importation de "all". 

use warnings: :register; 
if (warnings: :enabled()) { 

warnings: :warn("un avertissement"); 

} 

if (warnings: :enabled("void")) { 

warnings : :warn("void", "un avertissement"); 

} 

Ce pragma de portee lexicale permet un controle souple sur les avertissements internes 
de Perl, a la fois ceux emis par le compilateur et ceux provenant du systeme d'execution. 

Autrefois, le seul controle que vous aviez sur le traitement des avertissements de votre 
programme se faisait par le biais de l'option de la ligne de commande -w ou de la varia- 
ble $ A W Bien qu'utile, ces solutions tendaient a faire du tout-ou-rien. L'option -w active 
des avertissements dans des morceaux de code que vous pouvez ne pas avoir ecrits, ce 
qui est parfois problematique pour vous et embarassant pour Fauteur original. L'emploi 
de $ A W, soit pour activer, soit pour desactiver des blocs de code, peut s'averer moins 
qu'optionnel car il ne fonctionne que durant l'execution et non pendant la compila- 
tion. 4 Un autre probleme est que cette variable globale a tout le programme possede 
une portee dynamique et non lexicale. Cela signifie que si vous l'activez dans un bloc et 
qu'ensuite vous appelez a partir de la un autre code, vous risquez ici encore d'activer des 
avertissements dans du code qui n'est pas developpe avec exactement de tels standards 
a l'esprit. 

Le pragma warnings contourne ces limitations en possedant une portee lexicale, des me- 
canismes durant la compilation qui permettent un controle plus fin sur l'endroit oil les 
avertissements peuvent ou ne peuvent pas etre declenches. Une hierarchie de categories 
d'avertissements (voir lafigure 31-1) a ete definie pour permettre aux groupes divertis- 
sements d'etre actives ou desactives separement les uns des autres. (La categorisation 
exacte est experimentale et sujette a modifications.) Ces categories peuvent etre combi- 
nees en passant des arguments multiples a use ou no : 



4. En l'absence de blocs BEGIN, bien entendu. 
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unsafe 



— syntax 



uninitialized 



void 



redefine 



] 



substr 



signal 



closure 



overflow 



portable 



untie 



utf8 



pipe 



unopened 



closed 



newline 



ambiguous 



semicolon 



precedence 



reserved 



digit 



parenthesis 



deprecated 



printf 



inplace 



internal 



debugging 



Figure 31-1. Categories des avertissements Perl 
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use warnings qw(void redefine); 
no warnings qw(io syntax untie); 

Si des instances multiples du pragma warnings sont actives pour un groupe donne, leurs 
effets se cumulent : 

use warnings "void"; # Seuls les avertissements "void" sont actifs. 

use warnings "io"; # Les avertissements "void" et "io" sont 

# maintenant tous deux actifs. 

no warnings "void"; # Seuls les avertissements "io" sont maintenant 

# actifs. 

Pour donner des erreurs fatales pour tous les avertissements actives par un pragma war- 
nings particulier, utilisez le mot FATAL devant la liste d'importation. Ceci est tres utile 
lorsque vous aimez mieux qu'une certaine condition, qui d'ordinaire n'aurait cause 
qu'un avertissement, arrete votre programme. Supposez par exemple que vous conside- 
riez l'emploi d'une chame invalide en tant que nombre (qui normalement aurait donne 
une valeur de 0) si incorrect que vous vouliez que cet acte effronte tue votre programme. 
Pendant que vous y etes, vous decidez que Futilisation de valeurs non-initialisees en lieu 
et place de chaines reelles ou de valeurs numeriques doit egalement etre la cause d'un 
suicide immediat : 

{ 

use warnings FATAL => qw(numeric unitialized); 
$x = $y + $z; 

} 

Maintenant, si $y ou $z ne sont pas initialisers (c'est-a-dire, contiennent la valeur scalai- 
re speciale undef ) ou si dies contiennent des chaines qui ne se convertissent pas propre- 
ment en valeurs numeriques, au lieu de continuer gentiment son chemin ou tout au 
plus d'emettre une petite complainte si vous aviez active -w, votre programme levera 
maintenant une exception. (Pensez a cela comme du Perl tournant en mode Python.) 
Si vous n'interceptez pas les exceptions, dies causeront une erreur fatale. Le texte de l'ex- 
ception est le mime que celui qui serait normalement apparu dans le message divertis- 
sement. 

Le pragma warnings ignore l'option de la ligne de commande -w et la valeur de la varia- 
ble $ A W ; les configurations du pragma sont prioritaires. Toutefois, le drapeau -W de la 
ligne de commande passe outre le pragma, en activant totalement les avertissements 
dans tous le code a l'interieur de votre programme, y compris le code charge avec do, 
require ou use. En d'autres termes, avec -W, Perl pretend que chaque bloc de votre pro- 
gramme possede un pragma use warnings 'all'. Pensez-y comme un //nt(l) pour les 
programmes Perl. (Mais voyez egalement la documentation en ligne du module 
B : : Lint.) Le drapeau -X de la ligne de commande fonctionne a l'inverse. II pretend que 
chaque bloc a un no warnings 'all' active. 

Plusieurs fonctions sont fournies pour assister les auteurs de modules qui veulent que 
les fonctions de leur module se comportent comme les fonctions internes en respectant 
la portee lexicale de l'appelant (c'est-a-dire, de maniere a ce que les utilisateurs du mo- 
dule puissent lexicalement activer ou desactiver les avertissements que le module pour- 
rait emettre) : 
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warnings: : register 

Enregistre le nom du module courant comme une nouvelle categorie divertisse- 
ments, afin que les utilisateurs du module puissent en stopper les avertissements. 

warnings: : enabled (CATEGORIE) 

Renvoie vrai si la categorie CATEGORIE est activee dans la portee lexicale du module 
appelant. Sinon, renvoie faux. Si CATEGORIE n'est pas fournie, le nom du paquetage 
courant est utilise. 

warnings: :viam(CATEGORIE , MESSAGE) 

Si le module appelant n'a pas positionne CATEGORIE a « FATAL », affiche MESSAGE 
sur STDERR. Si le module appelant a positionne CATEGORIE a « FATAL », affiche MES- 
SAGE sur STDERR, puis meurt. Si CATEGORIE n'est pas fournie, le nom du paquetage 
courant est utilise. 



32 

Modules standards 



L'edition precedente de ce livre couvrait de maniere tres complete et definitive tous les 
modules faisant partie de la distribution standard de Perl. Si nous avions refait la meme 
chose ici, vous auriez payez de livre le double, sans parler de ce que vous auriez du payer 
au chiropracteur apres avoir essaye de porter le livre jusqu'a chez vous. Ces dernieres an- 
nees, de plus en plus de modules ont ete inclus dans la distribution standard ; nous en 
sommes a ce jour a environ deux cents. Certains d'entre eux, comme CGI, proposent 
eux-memes une documentation remarquablement approfondie. Et si vous utilisez la 
distribution de Perl ActiveState, votre bibliotheque standard est encore plus raffinee. 

Ainsi, nous vous offrons a la place une enumeration complete des modules standards, 
classes par type, accompagnes d'une breve description. Puis, cerise sur le gateau, nous 
avons selectionne quelques uns de nos modules favoris, vous en donnant des exemples 
d'utilisation classique, suivis d'une courte description de leur fonctionnement, juste 
pour que vous y goutiez un peu. Les descriptions sont suggestives plutot que completes 
et quasiment tous les modules ont d'autres fonctionnalites que celles que nous mon- 
trons. Toutefois, une documentation complete de tous les modules standards est incluse 
dans chaque distribution de Perl, vous n'avez done qu'a rechercher les details sur votre 
propre systeme en utilisant le programme perldoc, la commande man{\) de votre syste- 
me ou votre navigateur prefere. Voir la section Documentation en ligne de la preface. De- 
mandez a votre expert maison si vous ne trouvez pas les documents, car ils sont quasi 
certainement quelque part sur votre systeme. Et meme si ils n'y sont pas, vous pouvez 
toujours les lire au format pod directement dans les modules eux-memes car toute la 
documentation des modules est inseree dans le fichier de module (.pm) lui correspon- 
dant et le format pod a ete concu pour etre assez lisible. (Pas comme, disons, HTML.) 

Listes par type 

Le nom des modules ordinaires commence par une majuscule. Des noms en minuscules 
indiquent des pragmas dont vous trouverez la documentation au chapitre 31, Modules 
de pragmas, plutot que dans le present chapitre. 
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Types de donnees 

Ces modules etendent le systeme de typage de Perl (ou plutot ses lacunes) de diverses 
manieres. 



Module 


Descrintion 


Class: : Struct 


Cree des classes d objets Perl ressemblant a struct . 


constant 


l—v FA 1 1* 1 1 • * 

Declare des scalaires et des hstes constantes. 


integer 


Force Perl a faire de 1 anthmetique avec des entiers au heu de 




nombres a virgule f lottante. 


Math: :BigFloat 


ill i i > ■ i n . ■ • j i l 

Calcule avec des nombres a virgule f lottante d une longueur 




arbitraire. 


Math : : Biglnt 


Calcule avec des entiers de longueur arbitraire. 


Mah : : Complex 


Calcule avec des nombres complexes et les fonctions mathema- 




tiques associees. 


Math: :Trig 


Charge beaucoup de fonctions trigonometriques. 


overload 


Surcharge les operateurs Perl sur des objets. 


Symbol 


Manipule les tables de symboles de Perl et genere des type- 




globs anonymes. 


Time: Local 


Calcule efficacement la date et l'heure origine selon locatime 




ou gmtime. 



Traitement des chaines, traitement de textes 
linguistiques, analyse et recherche 

Ces modules agissent avec (ou sur) des textes. 



Module 


Description 


Search: :Dict 


Effectue une recherche binaire d'une chaine dans un fichier 






texte trie. 


Text: 


:Abbrev 


Cree une table d'abbreviation a partir d'une liste. 


Text: 


:ParseWords 


Analyse du texte dans une liste de tokens ou dans un tableau 






de tableaux. 


Text: 


:Soundex 


Utilise l'algorithme Soundex de Knuth. 


Text: 


:Tabs 


Developpe ou reduit les tabulations comme expand(l) ou unex- 






pand(l). 


Text: 


:Wrap 


Equilibre des lignes pour former des paragraphes simples. 
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Traitement des options, arguments, parametres et 
fichiers de configurations 

Ces modules traitent votre ligne de commande. 



Module 


Description 


Getopt: 


Long 


Traite des options etendues de la ligne de commande dans une 






forme longue (-xyz). 


Getopt: 


Std 


Traite des options d'un seul caractere avec regroupement 






d'options. 



Noms defichier, systemes de fichiers et verrouillage de 
fichiers 

Ces modules fournissent des methodes d'acces aux fichiers sur plusieurs plates-formes. 



Module 


Description 


Cwd 




Obtient le chemin du repertoire de travail courant. 


File: 


:Basename 


Decompose de maniere portable le nom d'un chemin en ses 






composants : repertoire, nom de base et extension. 


rile : 


:CheckTree 


Lance plusieurs tests de fichiers sur un ensemble d'arborescen- 






ces de repertoires. 


File: 


: Compare 


Compare de maniere portable les contenus de fichiers ou de 






handles de fichiers. 


File: 


:Copy 


Copie de maniere portable des fichiers ou des handles de 






fichiers ou deplace des fichiers. 


File: 


:DosGlob 


Realise des globs dans le style Microsoft. 


File: 


:Find 


Parcourt une arborescence de fichiers comme find(\). 


File: 


:Glob 


Utilise des globs dans le style Unix. 


File: 


:Path 


Cree ou supprime de maniere portable une serie de repertoi- 
res. 


File: 


:Spec 


Utilise des operations portables sur les fichiers (interface orien- 






tee objet). 


File: 


:Spec: : Functions 


Utilise des operations portables sur les fichiers (interface fonc- 






tionnelle). 


File: 


:Spec: :Mac 


Utilise des operations sur les fichiers pour Mac OS. 


File: 


:Spec: :0S2 


Utilise des operations sur les fichiers pour OS/2. 


File: 


:Spec: :Unix 


Utilise des operations sur les fichiers pour Unix. 


File: 


: Spec :: VMS 


Utilise des operations sur les fichiers pour VMS. 


File: 


:Spec: :Win32 


Utilise des operations sur les fichiers pour Microsoft. 


File: 


:stat 


Supplante les fonctions stat et lstat avec une interface utili- 






sant des methodes. 
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Utilitaires pour les handles defichiers, les handles de 
repertoires et les flux d'entrees/sorties 

Ces modules foumissent un acces oriente objet aux fichiers, aux repertoires et aux IPC. 



Module 


Description 


DirHandle 


Utilise des methodes objets pour les handles de repertoires. 


FileCache 


Garde plus de fichiers ouverts simultanement en ecriture que 




votre systeme ne le permet. 


FileHandle 


Utilise des methodes objets pour les handles de fichiers. 


10 


Fournit un frontal pour charger tous les modules 10 : : Dir, 




10: :File, 10: :Handle, 10: :Pipe, 10: :Seekable et 10: :Socket. 


10: :Dir 


Utilise des methodes objets pour les handles de repertoires. 


10: : File 


Utilise des methodes objets en rapport avec les fichiers pour les 




handles de fichiers. 


10: :Handle 


Utilise des methodes objets generiques pour les handles de 




fichiers/ 


10: : Pipe 


Utilise des methodes objets pour les pipes. 


10:: Poll 


Fournit une interface orientee objet a l'appel systeme poll(2). 


10: :Seekable 


Utilise des methodes objets pour les objets d'entrees/sorties 




dans lesquels on peut faire des recherches (avec seek). 


10: : Select 


Utilise une interface orientee objet facilitant l'appel systeme 




select(2). 


SelectSaver 


Sauvegarde et restaure les handles de fichiers selectionnes. 


Internationalisation et locales 


Ces modules vous aident dans vos activites extra-americaines. 


Module 


Description 


bytes 


Force l'ancienne semantique orientee octets. 


charnames 


Definit les noms de caracteres utilises dans les sequences 




d'echappements \N{nom} pour les chaines litterales. 


Il8N::Collate 


Compare des donnees scalaires de 8 bits selon la locale cou- 




rante (deprecie). 


locale 


Utilise ou evite les locales POSIX pour les operations internes. 


utf8 


Bascule explicitement sur le support UTF-8 et Unicode. 
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Interfaces au systeme Sexploitation 

Ces modules ajustent votre interface au systeme d'exploitation. 



Module 


Description 


Fcntl 


Charge les definitions de fcntl.h de la bibliotheque C en tant 
que constantes Perl. 


filetest 


Controle les operateurs de tests de fichiers (-r, -w, etc.) pour les 
systemes non-traditionnels. 


open 


Positionne les disciplines par defaut pour les appels a la fonc- 
tion open. 


POSIX 


Utilise l'interface Perl a POSIX 1003.1. 


Shell 


Lance des commandes shells de maniere transparente a l'inte- 
rieur de Perl. 


sigtrap 


Active une gestion simple des signaux. 


Sys: : Hostname 


Essaye de maniere portable tous les moyens imaginables pour 
determiner le nom de l'hote courant. 


Sys: :Syslog 


Utilise les fonctions syslog(3) de la bibliotheque C. 


Time: : gmtime 


Supplante la fonction interne gmtime par une interface metho- 
des. 


Time: :localtime 


Supplante la fonction interne localtime par une interface 
methodes. 


Time: :tm 


Fournit l'objet interne utilise par Time:: gmtime et 
Time: : localtime. 


User: :grent 


Supplante les fonctions internes getgr* par une interface 
methodes. 


User: :pwent 


Supplante les fonctions internes getpw* par une interface 
methodes. 



Communication reseau et interprocessus 

Ces modules fournissent des interfaces abstraites a cote des interfaces basiques que nous 
avons decrites au chapitre 16, Communication interprocessus. 



Module 


Description 


10: 


Socket 


Utilise une interface orientee objet generique pour les com- 
munications sur des sockets. 


10: 


Socket ::INET 


Utilise une interface orientee objet pour les sockets du 
domaine Internet. 


10: 


Socket:: UNIX 


Utilise une interface orientee objet pour les sockets du 
domaine Unix (locales). 


IPC 


:Msg 


Utilise des methodes objets pour travailler avec les messages 
System V (classe objet SysV Msg IPC). 
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Module 


Description 


IPC: 


:0pen2 


Ouvre un processus en lecture et ecriture simultanees. 


IPC: 


:0pen3 


Ouvre un processus pour lire, ecrire et gerer les erreurs. 


IPC: 


: Semaphore 


utilise ties rnernocies opjets pour les seiridpnores oystem v. 


IPC: 


:SysV 


Definit des constantes pour tous les mecanismes des IPC Sys- 

l L 1 1 1 V . 


Net: 


:hostent 


Ci i r"iT~tl ontp 1 pc fr\nr"ti nnc mtpmpc cr^ i~ hnc i~ ^ v\ a r imp i n \p* v^cxcf* 

OLippidllLC ICS ILHU-LlUllS 111LC1 llCS gC LI lUb L JJdl HI 1L lllLClldt_C 

methodes. 


Net: 


:netent 


OLippidllLC ICS lUllLllUllS lllLCillcS gcLllcL pdl UllC lllLCiidLC 

methodes. 


Net: 


:Ping 


venrie si un note ciistant est joignaDie. 


Net: 


:protoent 


Supplante les fonctions internes getproto* par une interface 
methodes. 


Net: 


:servent 


Supplante les fonctions internes getserv* par une interface 
methodes. 


Socket 


Charge les definitions et les fonctions manipulant des structu- 






res de socket.h de la bibliotheque C. 



World Wide Web 

Ces modules interfacent le WWW. Vous devez en avoir entendu parler. 



Module 


Description 


CGI 




Accede aux formulaires CGI et a la generation performante et 






automatique de HTML. 


CGI: 


:Apache 


Fait fonctionner vos scripts CGI sous l'API Perl-Apache. 


CGI: 


:Carp 


Ecrit dans le journal d'erreurs CGI de httpd(8) (ou d'autres). 


CGI: 


: Cookie 


Lit et ecrit des cookies HTTP. 


CGI: 


:Fast 


Utilise le protocol Fast CGI. 


CGI: 


: Pretty 


Produit du code HTML agreablement formate. 


CGI: 


:Push 


Realise des scripts CGI server-push (N.d.T. : sollicites par le ser- 






veur). 



Interfaces DBM 

Ces modules chargent diverses bibliotheques de gestion de bases de donnee. 



Module 


Description 


AnyDBM_File 


Fournit une infrastructure pour de multiples bibliotheques 




DBM. 


DBFile 


Fournit un acces lie avec tie a la bibliotheque db(3) (Berkeley 




DB, version 1.x). 



Listes par type 
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Module 


Description 


GDBM_File 


Fournit un acces lie avec tie a la bibliotheque gdbm{3). 


NDBM_File 


Fournit un acces lie avec tie a la bibliotheque ndbm(5). 


SDBM_File 


Fournit un acces lie avec tie aux fichiers sdbm(3) (simple 




DBM). 



Interfaces utilisateurs 



Ces modules fournissent une API decente pour les entrees/sorties de l'interface en ligne 



de commande. 




Module 


Description 


Term: :Cap 


Utilise la bibliotheque termcap(3). 


Term: : Complete 


Realise une completion programmable par des commandes 




sur des listes de mots. 


Term: :Readline 


Utilise l'un des nombreux paquetages readline. 



Authentification, securiteet encryptage 

Ces modules fonctionnent avec les espaces memoires proteges dans lesquels s'executent 
les programmes. 



Module 


Description 


Opcode 


Active ou desactive les lors codes d'operations (opcodes) de la 
compilation de code Perl en vue d'une utilisation avec le 
module Safe. 


ops 


Restreint les operations non-sures lors de la compilation. 


Safe 


Compile et execute du code dans des compartiments restreints. 


Langage Perl, extensions et mecanismes internes 


(A ne pas confondre avec les intentions et les mecanismes externes.) 


Module 


Description 


attributes 


Consulte ou positionne les attributs d'un sous-programme ou 
d'une variable. 


attrs 


Consulte ou positionne les attributs d'un sous-programme ou 
d'une variable (obsolete). 


base 


Etablit l'heritage des classes de base a la compilation. 


Data: : Dumper 


Serialise des structures de donnees Perl. 


DB 


Accede a l'API experimentale du debogueur Perl. 


Devel: :DProf 


Profile l'execution d'un programme Perl. 



826 


Chapitre 32 — Modules standards 


Module 


Description 


Devel: :Peek 


Charge des outils de debogage de donnees pour les program- 
meurs XS. 


diagnostics 


Force des avertissements verbeux et elimine les duplications. 


Dumpvalue 


Affiche a l'ecran des valeurs de donnees. 


English 


Utilise des noms de variables plus longs pour les variables 
internes avec une ponctuation. 


Env 


Accede aux variables d'environnement dans %ENV en tant que 
scalaires ordinaires. 


Errno 


Charge les definitions de errno.h de la bibliotheque C et lie la 
variable %! avec tie. 


Fatal 


Remplace les fonctions internes avec des versions levant des 
exceptions lors d'un echec. 


fields 


Lors de la compilation declare les donnees attributs d'une 
classe et verifie les acces a ces donnees. 


less 


Demande moins de quelque chose de la part de Perl (non- 
implemente). 


re 


Altere le comportement par defaut des expressions regulieres. 


strict 


Restreint les constructions baclees. 


subs 


Predeclare les noms de sous-programmes dans le paquetage 
courant. 


vars 


Predeclare des variables globales (obsolete voir our au chapitre 
29. 



Classes commodes 

Ces modules fournissent des classes de base et d'autres facilites. 



Module 


Description 


Tie: 


: Array 


Fournit une classe de base pour les tableaux lies avec tie. 


Tie: 


: Handle 


Fournit une classe de base pour les handles lies avec tie. 


Tie: 


:Hash 


Fournit une classe de base pour les hachages lies avec tie. 


Tie: 


:RefHash 


Fournit des references comme clefs de hachage. 


Tie: 


: Scalar 


Fournit une classe de base pour les scalaires lies avec tie. 


Tie: 


:SubstrHash 


Fournit une interface similaire aux hachages pour une table de 






taille fixe avec des clefs de longueur fixe. 


UNIVERSAL 


Fournit une classe de base pour toutes les classes (references 






consacrees). 



Listes par type 
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Avertissements et exceptions 

Que faire lorsque les choses se passent mal. 



Module 


Description 


Carp 

warnings 


Fournit des routines qui font des warn et des die avec la pers- 
pective de l'appelant. 

Controle les avertissements a l'interieur de la portee lexicale. 



Support de documentation 

II existe une quantite de documentation a supporter. 



Module 


Description 


Pod : 


: Checker 


Verifie les erreurs de syntaxes des documents pod (utilise par 
podchecker(l)) . 


Pod: 


functions 


Liste les fonctions internes par type. 


Pod: 


:Html 


Convertit les fichiers pod en HTML (utilise par pod2html(l)). 


Pod: 


:InputOb jeers 


Gere le support de documentation. 


Pod: 


:Man 


Convertit du pod en format trofflV) pour le systeme man(l) 
(utilise par pod2man{\)). 


Pod: 


: Parser 


Fournit une classe de base pour creer des filtres et des traduc- 
teurs de pod. 


Pod: 


: Select 


Extrait des sections de pod depuis l'entree (utilise par podse- 
lectO)). 


Pod: 


:Text 


Convertit des donnees pod en texte formate en ASCII (utilise 
par pod2text{\)). 


Pod: 


:Text: : Color 


Convertit des donnees pod en texte formate en ASCII avec les 
sequences d'echapement ANSI pour les couleurs. 


Pod: 


:Text: :Termcap 


Convertit des donnees pod en texte ASCII avec les sequences 
d'echappement specifiques du terminal. 


Pod: 


: Usage 


Affiche un message d'utilisation derive de la documentation 
pod incluse dans le source. 



Support d'installation de module 

Ces modules aident d'autres modules a sauter a travers differents cerceaux. 



Module 


Description 


AutoLoader 


Charge des sous-programmes a la demande. 


AutoSplit 


Eclate un paquetage pour Pautochargement. 


autouse 


Differe le chargement d'un module jusqu'a ce qu'une fonction 




de ce module soit utilisee. 
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Module 


Description 


blib 




utilise id uiDiiomeque ciepuis id version non-instaiiee u une 






extension par Makemaker. 


Config 




A pppnfl n i v i ri~\ v ni *i h i /"\ c r\c* pah I i <yi i 1*1 l"i f\n <H a Poi-l 
rtLLCUC dUA llllOillldllOllS U.C LOllllgUldLlOll UC I Cll. 


CPAN 




Interroge, rapatrie et construit des modules Perl depuis des 






eifpe PPAKT 

MLCS V. 1 rtiM . 


Devel: :SelfStubber 


Genere des souches (N.d.T. : stubs) pour un module en utilisant 






ie mouuie oeiTLOdaer. 


DynaLoader 


Charge dynamiquement des bibliotheques C ou C++ en tant 






nii'pYtpnQi'nnQ Ppt*1 

U LI CALC11SHJ113 J_ CI 1. 


Exporter 




Implemente une methode d'importation par defaut pour les 






mouuies traciitionneis. 


ExtUtils: 


: Command 


Prvnnrit Hpc i i ti li tciivpc nnni* vpTnnl^ir'^T* Ipc rnmmaTirlpc pv^pttipc 

JTOU.1111L U.C5 UllllldllC:) UOU-1 IClllUldCCl ICS LOlllllldllLlCj CALCI11C5 






populaires dans un Makefile. 


ExtUtils: 


: Embed 


Fournit des utilitaires pour inclure du Perl dans des program- 






mes C ou C++. 


ExtUtils: 


: Install 


Installe des fichiers dans la bibliotheque Perl du systeme. 


ExtUtils: 


: Installed 


Gere l'inventaire des modules installee. 


ExtUtils: 


:Liblist 


Determine quelles bibliotheques utiliser et comment les utili- 
ses 


ExtUtils: 


:MakeMaker 


Cree un Makefile pour une extension Perl. 


ExtUtils: 


: Man if est 


Charge des outils pour ecrire et verifier un fichier MANIFEST. 


ExtUtils: 


:Miniperl 


l^llL ULl pULll yCl lllllilll.L. 


ExtUtils: 


:Mkbootstrap 


Creer un fichier d'amorcage (bootstrap) pour etre utilise par 






uynaLOdaer . 


ExtUtils: 


:Mksymlists 


Ecrit des fichiers d'options de Pediteur de liens pour les exten- 






sions uyndmiques. 


ExtUtils: 


:MM Cygwin 


ouppiaine iesiiicLiiou.es se coinpoiidiiL d id inaiiieie u unix 






dans ExtUtils: :MakeMaker. 


ExtUtils: 


:MM_0S2 


OLippidllLClCS 111CLHOLICS SC LOllipOl Idlll a Id llldlllCiC U. U111X 






dans ExtUtils: :MakeMaker. 


ExtUtils: 


:MM_Unix 


rournit ues metnocies utmsees par txxuxiis. . ridKenaKci. 


ExtUtils: 


:MM_VMS 


ouppiainc les iiiemuucs se cumpoi tain a la inaiiieie u uiiia 






dans ExtUtils: :MakeMaker. 


ExtUtils: 


:MM_Win32 


Supplante les methodes se comportant a la maniere d'Unix 






dans ExtUtils: :MakeMaker. 


ExtUtils: 


:Packlist 


Gere les fichiers .packlist. 


ExtUtils: 


:testlib 


Ajoute des repertoires blib/* a @INC. 


FindBin 




Localise le repertoire d'installation pour le programme Perl en 






train de tourner. 


lib 




Manipule @INC lors de la compilation. 


SelfLoader 


Charge des fonctions uniquement a la demande. 



Listes par type 
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Module 


Description 


XSLoader 


Charge dynamiquement des bibliotheques C ou C++ en tant 
qu'extensions Perl. 


Support de developpement 


Ces modules s'occupent des mesures de temps et des tests, pour voir dans quelles pro- 
portions votre code ne tourne ni plus rapidement, ni plus proprement. 


Module 


Description 


Benchmark 


Compare les temps d'execution de differentes versions de code. 


Test 


Utilise une infrastructure simple pour ecrire des scripts de test. 


Test: : Harness 


Lance des scripts de test standards avec des statistiques. 



Compilateur Perl etgenerateur de code 

Ces modules supportent des generateurs de code vers des sorties (N.d.T. : backends) di- 
verses et variees pour Perl. 



Module 


Description 


B 




Charge des generateurs de code Perl (alias le « compilateur 
Perl »). 


B: 


:Asmdata 


Fournit une donnee autogeneree sur les operations atomiques 
Perl pour produire du bytecode. 


B: 


: Assembler 


Assemble du bytecode Perl. 


B: 


:Bblock 


Parcours les blocs basiques dans l'arbre syntaxique. 


B: 


:Bytecode 


Utilise la sortie en bytecode du compilateur Perl. 


B: 


:C 


Utilise la sortie de traduction en C du compilateur Perl. 


B: 


:CC 


Utilise la sortie traduction optimisee en C du compilateur Perl. 


B: 


: Debug 


Parcours l'arbre syntaxique Perl en affichant les infos de debo- 
gage a propos des operations atomiques. 


B: 


:Deparse 


Utilise la sortie du compilateur Perl pour reproduire du code 
Perl. 


B: 


: Disassembler 


Disassemble du bytecode Perl. 


B: 


:Lint 


Decele les constructions douteuses. 


B: 


: Showlex 


Montre les variables lexicales utilisees dans des fonctions ou 
des fichiers. 


B: 


: Stash 


Montre quelles tables de symboles sont chargees. 


B: 


: Terse 


Parcours l'arbre syntaxique Perl en affichant des infos laconi- 
ques a propos des operations atomiques. 


B: 


:Xref 


Genere des rapports avec des references croisees pour les pro- 
grammes Perl. 
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Module 


Description 


ByteLoader 
0 


Charge du code Perl compile en bytecode. 

Fournit une interface generique aux sorties (backends) du com- 
pilateur Perl. 



Modules relatifs a Microsoft 

Si vous possedez la distribution Perl pour les systemes Microsoft provenant d'ActiveSta- 
te, les modules suivants, qui sont uniquement pour Microsoft, sont d'ores et deja inclus 
pour vous. Si vous avez juste ete chercher les sources de la distribution standard (en vou- 
lant peut-etre la compiler avec l'emulateur d'environnement Unix de Cygwin) mais que 
vous tournez sur Wintel, vous pouvez obtenir tous ces modules depuis CPAN. 



Module 


Description 


Win32 : 


: ChangeNotif y 


Surveille les evenements relatifs aux fichiers et aux repertoires. 


Win32: 


:Console 


Utilise la console Win32 et les fonctions du mode caractere. 


Win32: 


: Event 


Utilise les objets evenemetns Win32 depuis Perl. 


Win32: 


: EventLog 


Traite les journaux d'evenements Win32 depuis Perl. 


Win32: 


:File 


Gere les attributs de fichier en Perl. 


Win32: 


:FileSecurity 


Gere les FileSecurity Discretion Access Control Lists (Listes de con- 
trole d'acces discret aux fichiers securises) en Perl. 


Win32 : 


,Tnr 


Charge la classe de base pour les objets de synchronisation 
Win32. 


Win32: 


: Internet 


Accede aux fonctions de WININET.DLL. 


Win32: 


:Mutex 


Utilise les objets mutex Win32 en Perl. 


Win32: 


:NetAdmin 


Gere les groupes et utilisateurs reseaux en Perl. 


Win32: 


:NetResource 


Gere les ressources reseaux en Perl. 


Win32: 


:0DBC 


Utilise les extensions ODBC pour Win32. 


Win32: 


:0LE 


Utilise les extensions d'automatisation OLE. 


Win32: 


:0LE::Const 


Extrait les definitions de constantes depuis TypeLib. 


Win32: 


:0LE: :Enum 


Utilise OLE Automation Collection Objects (objets collections 
d'automatisation OLE). 


Win32: 


:0LE: :NLS 


Utilise OLE National Langage Support (support de langages 
nationaux OLE). 


Win32: 


:0LE: :Variant 


Cree et modifie les variables OLE VARIANT. 


Win32: 


:PerfLib 


Accede au compteur de performance de Windows NT. 


Win32: 


: Process 


Cree et manipule des processus. 


Win32: 


: Semaphore 


Utilise les objets semaphores Win32. 


Win32: 


: Service 


Gere les services du systeme. 


Win32: 


: Sound 


Joue avec les sons Windows. 


Win32: 


:TieRegistry 


Trifouille la base de registres. 



Benchmark 
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Module 


Description 


Win32API: 


:File 


Accede aux appels bas niveau de l'API systeme Win32 pour les 






fichiers et les repertoires. 


Win32API: 


:Net 


Gere les comptes LanManager de Windows NT. 


Win32API: 


: Registry 


Accede aux appels bas niveau de 1API systeme Win32 depuis 






WINREG.H. 



Benchmark 



use Benchmark qw(timethese cmpthese timeit countit timestr); 

# Vous pouvez toujours passer du code sous forme de chaines : 
timethese $compteur, { 

'Noml' => \..codel...\ 

'Nom2' => '...code2...', 

}; 



# Ou sous forme de references a des sous -programmes : 
timethese $compteur, { 

'Noml' => sub { ...codel... }, 

'Nom2' => sub { ...code2... }, 

}; 

cmpthese $compteur, { 

'Noml' => '...codel...', 
'Nom2' => '...code2...', 

}; 



$t = timeit $compteur, ' code'; 

print "$compteur boucles de code ont pris : ", timestr($t), "\n"; 

$t = countit $temps, ' code'; 
$compteur = $t->iters; 

print "$compteur boucles de code ont pris : ", timestr($t), "\n"; 

Le module Benchmark peut vous aider a determiner lequel parmi plusieurs choix possi- 
bles s'execute le plus rapidement. La fonction timethese lance les segments de codes 
specifies le nombre de fois demande et rapporte combien de temps a pris chaque seg- 
ment. Vous pouvez obtenir un joli diagramme trie si vous appelez cmpthese de la meme 
facon. 

Les segments de codes peuvent etre passes sous forme de references de fonctions au lieu 
de chaines (en fait, il faut que ce soit des references de fonctions si vous utiliser des va- 
riables lexicales provenant de la portee de l'appelant), mais la surcharge engendree par 
Fappel peut inf luencer les mesures de temps. Si vous ne demandez pas assez d'iterations 
pour avoir une bonne mesure, la fonctions emet un avertissement. 

Des interfaces de bas niveau sont disponibles pour lancer un seul morceau de code soit 
un certain nombre de fois (timeit), soit un certain nombre de secondes (countit). Ces 



832 



Chapitre 32 — Modules standards 



fonctions renvoient des objets Benchmark (voir une description dans la documentation 
en ligne). Avec countit, vous savez que cela a tourne pendant assez longtemps pour evi- 
ter les avertissements, car vous aviez specifie un temps d'execution minimum. 

Pour tirer le meilleur profit du module Benchmark, vous aurez besoin d'un peu d'entrai- 
nement. En general, il n'est pas suffisant de lancer deux ou trois algorithmes sur le 
meme jeu de donnees, car les mesures de temps ne refletent que la maniere dont ces 
algorithmes se sont bien comporte sur ce jeu de donnees precis. Pour obtenir une 
meilleure impression sur le cas general, vous aurez besoin de lancer plusieurs ensembles 
de benchmarks en faisant varier les jeux de donnees utilises. 

Par exemple, imaginez que vous vouliez savoir le meilleur moyen d'obtenir la copie 
d'une chame sans ses deux derniers caracteres. Vous pensez a quatre facons de faire cela 
(il y en a d'autres bien stir) : chop deux fois, copier et substituer, ou utiliser substr soit 
sur la partie gauche, soit sur la partie droite d'un assignement. Vous testez ces algorith- 
mes sur des chames de longueur 2, 200 et 20_000 : 

use Benchmark qw/countit cmpthese/; 
sub lancer($) { countit(5, @_) } 
for $taille (2, 200, 20_000) { 
$c = "." x $taille; 
print "\nTAILLE_DONNEES = $taille\n"; 
cmpthese { 

chop2 => lancer q{ 

$t = $c; chop $t; chop $t; 

}, 

subs => lancer q{ 

($t = $c) =~ s/..\Z//s; 

}, 

substrg => lancer q{ 

$t = $c; substr($t, -2) = 

}, 

substrd => lancer q{ 

$t = substr($c, 0, length($c) -2); 

}, 

}; 

} 

ce qui affiche : 

TAILLE DONNEES = 2 



Rate 


substrg 


subs 


chop2 


substr d 


substr_g 579109/s 




-2% 


-36% 


-37% 


subs 593574/s 


2% 




-34% 


-36% 


chop2 903371/s 


56% 


52% 




-2% 


substr_d 920343/s 


59% 


55% 


2% 




TAILLE_D0NNEES = 200 








Rate 


subs 


substr g 


substr d 


chop2 


subs 561402/s 




-2% 


-8% 


-24% 


substrg 574852/s 


2% 




-6% 


-22% 


substrd 610907/s 


9% 


6% 




-17% 


chop2 737478/s 


31% 


28% 


20% 





Carp 
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TAILLE_ 


DONNEES = : 


20000 










Rate 


substr_d 


subs substrg 


chop2 


substr 


d 35885/s 




-45% 


-45% 


-46% 


subs 


65113/s 


81% 




-1% 


-3% 


substr 


g 65472/s 


82% 


1% 




-2% 


chop2 


66837/s 


86% 


3% 


2% 





Avec de petits jeux de donnees, l'algorithme « substr_d » tourne 2% plus rapidement 
que l'algorithme « chop2 », mais sur de grands jeux de donnees, il tourne 46% plus len- 
tement. 

Sur des jeux de donnees vides (aucun de montre ici), le mecanisme de substitution est 
le plus rapide. II n'y a done pas de solution meilleure que les autres dans tous les cas pos- 
sibles et meme ces mesures ne racontent pas toute l'histoire, puisque vous etes toujours 
a la merci de votre systeme d'exploitation et de la bibliotheque C avec laquelle Perl a ete 
compile. Ce qui est bon pour vous peut devenir mauvais pour quelqu'un d'autre. Cela 
prend un certain temps pour etre adroit avec les benchmarks. Entretemps, cela facilite 
les choses d'etre un bon menteur. 

Carp 

use Carp; 

croak "Nous en sommes la !"; 

use Carp qw(:DEFAULT cluck); 

cluck "Voila comment nous sommes arrives la !"; 

Le module Carp vous permet d'ecrire des modules dont les fonctions rapportent les er- 
reurs de la meme facon que les operateurs internes du point de vue de l'utilisateur du 
module. Le module Carp fournit des routines que vous utilisez pratiquement comme 
les fonctions internes standard warn et die, mais qui changent le nom de fichier et le 
numero de ligne de facon a ce que l'erreur ait Fair de provenir du code utilisateur plutot 
que de votre code. En bref, Carp est un moyen formidable de renvoyer la faute sur quel- 
qu'un d'autre que soi. 

II existe en fait quatre fonctions. La fonction carp marche comme l'operateur warn mais 
avec les informations sur le nom de fichier et le numero de ligne relatives a l'appelant. 
La fonction croak marche comme die en levant une exception mais en donnant la en- 
core des informations relatives a l'appelant. Si vous preferez une longue complainte, uti- 
lisez cluck et confess au lieu de carp et croak respectivement, et vous obtiendrez une 
trace complete de la pile rapportant qui a appele qui et arme de quels arguments (sans 
aucun doute le colonel Moutarde, dans la bibliotheque avec une clef anglaise). Vous de- 
vez importer cluck explicitement car il n'est pas exporte normalement. Les gens ne veu- 
lent pas en general des traces completes de la pile pour de simples avertissements, pour 
une raison ou pour une autre. 

CGI 

use CGI qw(: standard); 
$qui = param("Nom"); 



834 



Chapitre 32 — Modules standards 



$tel = param( "Telephone"); 
(Schoix = param("Choix"); 

Le module CGI vous aide a gerer des formulaires HTML, specialement les formulaires 
en plusieurs etapes oil il est critique de passer d'une etape a une autre. L'exemple extre- 
mement simple ci-dessus s'attend a traiter un formulaire avec deux parametres prenant 
des valeurs scalaires, comme des champs de texte ou des boutons radios et un autre pre- 
nant une valeur multiple, comme des listes deroulantes specifiers avec « MULTIPLE ». Le 
module est encore plus sympathique que cela a plusieurs niveaux, en supportant des 
fonctionnalites comme le traitement des cookies, les valeurs persistantes pour les cad- 
dies multiecrans et la generation automatique de listes HTML et de tables que vous pou- 
vez extraire d'une base de donnees pour n'en citer que quelques unes. Le support de 
l'execution a grande vitesse de scripts Perl precompiled via les services de mod_perl 
d'Apache est egalement fourni. Le livre de chez O'Reilly & Associates Writing Apache Mo- 
dules with Perl and C, de Lincoln Stein et Doug MacEachern, vous dira tout sur ce sujet. 

CGL.'Carp 

use CGI: :Carp; 

warn "Celle-ci est une complainte"; # Estampille avec le nom du 

# programme et la date 

die "Mais celle-la est serieuse"; # Mais ne cause pas d'erreur 

# serveur 500 

use CGI:: Carp qw(carpout); # Importe cette fonction 

open(L0Gj "> >/var/tmp/mon_cgi-log" 

or die "Impossible d'ajouter a mon_cgi-log : $!\n"; 
carpout(*LOG); # Utilise maintenant le journal 

# d'erreurs specifique au programme 

use CGI::Carp qw(fatalsToBrowser); 

die "Les messages d'erreurs fatales sont maintenant envoyes aussi au 
navigateur"; 

Le module CGI: :Carp fournit des versions des fonctions internes Perl warn et die, plus 
les fonctions carp, cluck, confess et croak du module Carp qui sont plus parlantes et 
plus sures egalement. Elles sont plus parlantes car chaque message inclut la date et 
l'heure avec le nom du programme qui a emis les messages, ce qui est une aide precieuse 
lorsque vous utilisez un fichier journal partage par une centaine de programmes diffe- 
rents qui le polluent tous en meme temps avec un millier de messages differents. 

Le module est egalement agreable pour les surfeurs du Web, puisque la mort prematu- 
ree d'un script CGI a tendance a causer des erreurs absconses « Server 500 » lorsque 
l'en-tete HTTP correcte ne part pas du serveur avant que votre programme ne trepasse, 
et ce module s'assure que cela ne se produit pas. La fonction carpout redirige tous les 
avertissements et toutes les erreurs vers le handle de fichier specifie. La directive fa- 
talsToBrowser envoie egalement une copie de tels messages au navigateur de l'utilisa- 
teur. Ces services facilitent le debogage des problemes dans les scripts CGI. 
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Classr.Struct 



use Class: :Struct; 



struct Chef => { 
nom => '$', 



}; 



salaire => '%' , 
debut => 



struct Boutique => { 
proprio => 



}; 



adrs => , 
stock => '%', 
patron => 'Chef 



# Cree un constructeur Chef->new(). 

# La methode nom() accede maintenant a une 

# valeur scalaire. 

# Ainsi que salaire(). 

# Ainsi que debutQ. 



# Cree un constructeur Boutique->new() . 

# La methode proprioQ accede maintenant a 

# un scalaire. 

# Et la methode adresseQ accede a un tableau. 

# Et la methode stock() accede a un hachage. 

# Initialise avec Chef->new(). 



$magasin = Boutique->new() ; 
$magasin->proprio('' Abdul Alhazred' ); 
$magasin->adrs(Oj 'Miskatonic University"); 
$magasin->adrs(lj 'Innsmouth, Mass.'); 
$magasin->stock("livres", 208); 
$magasin->stock("charmes", 3); 
$magasin->stock(" potions", "aucune"); 
$magasin->patron->nom(''Dr . L. P. Hache-"); 
$magasin->patron->salaire('folie J ); 
$magasin->patron->debut (scalar localtime); 

Le module Class : Struct foumit un moyen de « declarer » une classe ayant des objets 
dont les champs sont d'un certain type. La fonction qui fait cela est appelee struct. 
Comme les structures d'enregistrements ne sont pas des types de base en Perl, chaque 
fois que vous desirez creer une classe pour fournir un objet ressemblant a une donnee 
d'enregistrement, vous devez definir une methode constructeur ainsi que des methodes 
accesseurs pour chaque donnee de champ, quelquefois appelees methodes « wrapper ». 
La fonction struct du module Class : : Struct vous soulage de cette tache en creant une 
classe a la volee. Vous n'avez qu'a lui communiquer qu'elles doivent etre les donnees 
membres, ainsi que leur type. La fonction cree une methode constructeur appelee new 
dans le paquetage specifie par le premier argument, plus une methode accesseur d'attri- 
but pour chaque membre, comme specifie par le second argument, qui doit etre une 
reference de hachage. 

Les types de champ sont specifies, soit en tant que types internes en utilisant les symbo- 
les habituels « $ », « @ », « % » et « & », soit en tant qu'une autre classe en employant le 
nom de la classe. Le type de chaque champ sera force lorsque vous essayerez de modifier 
la valeur. 

Beaucoup de modules standards utilisent Class : Struct pour creer leur objets et acces- 
seurs, y compris Net : : hostent et User : : pwent, dont vous pouvez regardez les sources et 
vous en servir comme modeles. Voir egalement les modules CPAN Tie : : SecureHash et 
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Class : :Multimethods pour des approches plus elaborees de l'autogeneration de classes 
et de methodes accesseurs. Voir la section Gestion des donnees d'instance au chapitre 12, 
Objets. 

Config 

use Config; 

if ($Config{cc} =~ /gcc/) { 

print "Ce perl a ete compile avec GNU C.\n"; 

} 

use Config qw(myconfig config_sh config_vars); 

print myconfig(); # comme perl -V sans aucun motif 

print config_sh(); # donne absolument tout 

config_vars qw/osname osvers archname/; 

Le mecanisme de configuration utilise pour compiler et installer Perl rassemble une 
profusion d'informations sur votre systeme. Le module Config exporte par defaut une 
variable de hachage liee avec tie, nommee %Conf ig, qui donne acces a environ 900 va- 
leurs de configuration differentes. (Ces valeurs sont egalement accessibles a travers l'op- 
tion -V -.MOTIF de la ligne de commande de Perl.) Config fournit egalement trois 
fonctions qui donnent un acces a ces valeurs dans le style du shell, comme montre ci- 
dessus. Par exemple, le dernier appel pourrait afficher : 

osname=-'linux'' ; 
osvers= J 2.4.2 J ; 
archname^ i386-linux' ; 

La documentation en ligne du module decrit les variables de configuration et leurs va- 
leurs possibles. Prenez garde si vous deplacez votre executable perl vers un systeme autre 
que celui sur lequel il a ete compile, ces valeurs peuvent ne pas refleter la realite 
actuelle ; par exemple, si vous faites tourner un binaire Linux ou Solaris sur un systeme 
BSD. 

CPAN 

# Obtient un shell CPAN interactif . 
%perl -MCPAN -e shell 

# S J enquiert juste des recommandations de mise a niveau. 
% perl -MCPAN -e 'CPAN: :Shell->r J 

# Installe le module indique en mode batch. 

% perl -MCPAN -e "install Class: :Multimethods" 

Le module CPAN est une interface automatisee et conviviale au Comprehensive Perl Ar- 
chive Network, decrit au chapitre 22, CPAN. Au contraire de la plupart des modules que 
vous pouvez rencontrer, il est destine a etre invoque depuis la ligne de commande, exac- 
tement comme un petit programme. La premiere fois que vous Fappelez, le module 
vous demande le site miroir CPAN par defaut et d'autres renseignements dont il a be- 
soin. Apres cela, vous pouvez lancer son shell interactif pour faire des requetes et selec- 



Cwd 



837 



tionner des modules a installer, demander au module des recommandations sur les 
modules devant etre remis a niveau ou simplement lui faire installer un module parti- 
culier. 



use Cwd 'realpath'; 

print realpath("/usr////spool//mqueue/. ./"); # affiche /var/spool 

Le module Cwd fournit des fonctions independantes de la plate-forme pour determiner 
le repertoire de travail courant de votre processus. C'est mieux que de lancer un shell 
executant pwd(\) car les systemes non-conformes a POSIX ne garantissent pas qu'ils con- 
naissent une telle commande et Perl ne se limite pas uniquement a tourner sur les pla- 
tes-formes POSIX. La fonction getcwd, laquelle est exportee par defaut, renvoie le 
repertoire de travail courant en utilisant le mecanisme repute pour etre le plus sur sur 
la plate-forme courante. Si vous importez la fonction chdir, elle supplante l'operateur 
interne avec celui du module, lequel met a jour la variable d'environnement 
$ENV{PWD} ; les commandes que vous pourriez lancer ensuite et qui tiendraient compte 
de cette variable auraient alors une vision coherente de leur univers. La fonction real- 
path resout dans son argument representant un nom de chemin tous les liens symboli- 
ques et tous les composants de chemin relatif afin de renvoyer un chemin complet de 
repertoire sous une forme canonique, exactement comme realpath(3). 



use Data: : Dumper; 
print Dumper ($magasin); 

Lorsqu'on l'utilise sur l'exemple tire de la definition de Class : : Struct, ceci affiche : 

$VAR1 = bless ( { 

'Boutique: :patron' => bless( { 



Cwd 



use Cwd; 

$rep = getcwdQ; 



# Ou suis-je ? 



use Cwd 'chdir''; 
chdir "/tmp"; 



# Met a jour $ENV{PWD}. 



Data::Dumper 



'Chef : :salaire' => 



'folie', 
'Chef :: nom' => 



'Dr. L. P. Hache', 
'Chef::debut' => 




} 



'Fri Apr 13 19:33:04 2001' 
'Chef ), 



'Boutique: :stock' => { 



'livres' 

'charmes' 

'potions' 



> 208, 
=> 3, 

=> 'aucune' 



}, 
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' Boutique : :proprio' => 'Abdul Alhazred', 
'Boutique: :adrs' => [ 

'Miskatonic University', 
'Innsmouth, Mass.' 

] 

}, 'Boutique' ); 

La fonction Dumper du module Data : : Dumper prend une liste de scalaires (incluant des 
references, qui peuvent meme se referer a des objets) et renvoie une chaine affichable 
ou evaluable qui reproduit precisement une copie fidele de l'original. Vous pouvez uti- 
liser ceci pour ecrire une version de sauvegarde d'une structure de donnee dans un fi- 
chier ordinaire sur disque ou dans un fichier DBM, ou encore la passer a un autre 
processus via un pipe ou une connexion socket. Ce module peut etre utilise avec les mo- 
dules MLDBM de CPAN et DB_File pour implementer un fichier DBM a meme de stacker 
de maniere transparente des valeurs de donnees complexes, et non seulement des chai- 
nes a plat. D'autres module de transformation en chaines (stringification) (ou serialisa- 
tion, ou formatage de presentation, marshalling) incluent Storable et FreezeThaw, tous 
deux disponibles depuis CPAN. 

DB_File 

use DBFile; 

Lie avec tie un hachage a un fichier dans le style de DBM : 

tie(%hachage, "DB_File", $fichier) # Ouvre une base de donnees. 
or die "Impossible d'ouvrir $fichier : $!"; 

$v = $hachage{"clef "}; # Extrait depuis la base de donnees. 

$hachage{"clef "} = "valeur"; # Positionne une valeur dans la base, 

untie %hachage; 

Lie avec tie un hachage a un fichier B-tree (arbre balance ou equilibre), mais continue 
d'y acceder en tant que hachage DBM ordinaire : 

tie(%hachage, "DB_File", "monarbre", 0_RDWR|0_CREAT, 0666, $DB_BTREE) 
or die "Impossible d'ouvrir le fichier 'monarbre' : $!"; 

while (($c, $v) = each %hachage) { # Parcourt dans l'ordre 
print "$c => $v\n"; 

} 

Lie avec tie un tableau a un fichier texte brut : 

tie(@lignes, "DB_File", $fic_texte, 0_RDWR|0_CREAT, 0666, $DB_NUM_ENREG) 
or die "Impossible d'ouvrir le fichier texte $fic_texte : $!"; 

# Ecrit quelques lignes dans le fichier, en ecrasant les anciennes. 
$lignes[o] = "premiere ligne"; 
$lignes[l] = "deuxieme ligne"; 
$lignes[2] = "troisieme ligne"; 

push @lignes, "penultieme", "derniere"; # Met deux lignes a la fin 

# du fichier 
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$wc = scalar @lignes; 
$derniere = pop @lignes; 



# Compte le nombre de lignes 

# Supprime et extrait la derniere 

# ligne 



Le module DB_File donne un acces lie avec tie a une DB Berkeley. La fonction tie 
vous donne par defaut une base de donnees standard dans le style de DBM, avec certai- 
nes fonctionnalites que Ton ne retrouve dans aucune bibliotheque DBM : il n'existe pas 
de limites de taille ni pour les clefs, ni pour les valeurs et vos donnees sont stockees dans 
un format independant de l'ordre des octets. 

Le deuxieme mecanisme de tie utilise des B-trees (arbres balances ou equilibres) pour 
vous donner un veritable fichier ISAM (Indexed Sequential Access Method, methode d'ac- 
ces sequentiel indexe), c'est-a-dire un hachage dont les clefs sont automatiquement 
triees dans l'ordre alphabetique par defaut, mais configurable par l'utilisateur. 

Le troisieme mecanisme de tie lie un tableau a un fichier d'enregistrements (des lignes 
de texte par defaut) de facon a ce que les modifications dans le tableau se repercutent 
automatiquement sur le disque. Ceci simule un acces aleatoire par numero de ligne 
dans un fichier texte ordinaire. L'interface standard est conforme a la version 1.x de Be- 
rkeley DB ; si vous souhaitez employer les nouvelles fonctionnalites disponibles dans 
Berkeley 2.x ou 3.x, utilisez plutot le module BerkeleyDB de CPAN. 

A partir de la version 2.x, Berkeley DB supporte intrinsequement le verrouillage, ce qui 
n'etait pas le cas dans les versions precedentes. Voir la section Verrouillage de fichier du cha- 
pitre 16 pour un description de la maniere sure dont vous pouvez verrouillez n'importe 
quel type de fichier de base de donnees en utilisant flock sur un fichier semaphore. 



use Dumpvalue; 

Dumpvalue- >new->dumpValue($magasin); 
Lorsqu'on l'utilise sur l'exemple tire de la definition de Class : : Struct, ceci affiche : 

'Boutique: :adrs' => ARRAY(Ox8l6d548) 

0 'Miskatonic University' 

1 'Innsmouth, Mass.' 

'Boutique: rpatron' => Chef=HASH(Ox80fl538) 

'Chef : :debut' => 'Fri Apr 13 19:33:04 2001' 

'Chef::nom' => 'Dr. L. P. Hache' 

'Chef::salaire' => 'folie' 
'Boutique: :proprio' => 'Abdul Alhazred' 
'Boutique: :stock' => HASH(Ox8l976dO) 

'charmes' => 3 

'livres' => 208 

'potions' => 'aucune' 

II s'agit d'un autre module facilitant l'affichage de donnees complexes. II n'est pas tant 



1. Pourvu que vous ayez la bibliotheque installee sur votre systeme. Sinon, vous pouvez la com- 
piler et l'installer assez facilement. 
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destine au formatage de presentation (marshalling) qu'a un affichage agreable. II est uti- 
lise par la commande x du debogueur Perl. En tant que tel, il offre une quantite impres- 
sionnante d'options pour controler le format de sortie. II donne egalement acces aux 
tables de symboles de paquetages de Perl pour vider le contenu d'un paquetage entier. 

English 

use English; 

# Utilise des noms dans le style de awk 
$RS = "; # au lieu de $/ 
while (<>) { 

next id $NR < 10; # au lieu de $. 

} 

# Idem, mais encore plus long a la Cobol 
$INPUT_REC0RD_SEPARAT0R = "; 

while (<>) { 

next if $INPUT_LINE_NUMBER < 10; 

} 

Le module English fournit des alias encombrants pour les variables internes a destina- 
tion des prodigieux dactylos qui ont une haine viscerale des identificateurs non-alpha- 
betiques (et un amour visceral pour la touche Blocage Majuscules, ou Caps Lock). 
Comme avec toutes les importations, ces alias ne sont disponibles que dans le paquetage 
courant. Les variables sont toujours accessibles sous leur veritable noms. Par exemple, 
un fois que vous avez fait un use de ce module, vous pouvez utiliser $PID si $$ vous de- 
range ou $PR0GRAM_NAME si $0 vous donne mal au cceur. Certaines variables ont plus 
d'un alias. Voir le chapitre 28, Noms speciaux pour une description complete de toutes 
les variables internes et de leur alias en anglais tires du module English. 

Errno 

use Errno; 

unless (open(HF, $chemin)) { 

if ($!{EN0ENT}) { # Nous n'avons pas besoin d'importer ceci ! 

warn "$chemin n'existe pas\n"; 
else { 

warn "Echec de l'ouverture de $chemin : $!"; 

} 

} 

use Errno qw(EINTR EI0 :P0SIX) 
if ($! == ENOENT) { ... } 

Le module Errno rend accessibles les noms symboliques pour l'ensemble des valeurs de 
statut d'erreur lorsqu'un appel systeme echoue, mais il ne les exporte pas toutes par de- 
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faut. Le module n'a qu'un seul tag d'exportation, « : POSIX », qui n'exporte que les sym- 
boles definis dans le standard POSIX 1003.1. Le module rend egalement magique la 
variable globale %! en utilisant tie. Vous pouvez indicer le hachage %! en employant 
n'importe quelle valeur valide d'errno sur votre systeme, pas seulement les valeurs PO- 
SIX, et sa valeur n'est vraie que s'il s'agit de Ferreur actuelle. 



Exporter 



Dans votre fichier Mon_Module.pm : 
package MonModule; 

use strict; 
use Exporter; 

our $VERSI0N = 1.00; 
our @ISA = qw(Exporter); 

our @EXP0RT = qw(fl %h); 

our @EXP0RT_0K = qw(f2 f3); 
our %EXP0RT_TACS = ( 

a => [qw(fl f2 f3)], 

b => [qw(f2 %h)], 

); 

# Votre code ici. 



# Ou superieure. 



# Symboles importes par defaut. 

# Symboles importes seulement sur demande. 

# Mappage pour :raccourcis. 



use Mon_Module; 
use Mon_Module (); 
use Mon_Module "fl", "f2", "%h"; 
use Mon_Module qw( : DEFAULT f3); 

use Mon Module "f4"; 



Depuis un programme ou un autre module qui fait un use du votre : 

# Importe tout ce qu'il a dans ^Export. 

# Charge le module sans rien importer. 

# Deux fonctions et une variable. 

# Tout ce qu'il y a dans @Export + 

# une fonction. 

# Erreur fatale car f4 n'est pas exportee. 

Des que quelqu'un invoque une declaration use pour charger votre module, il appelle 
la methode import depuis votre module pour rapatrier tous les symboles dont il a be- 
som dans le paquetage de l'appelant. Votre module (celui qui fait les exportations) peut 
definir la methode import comme il le souhaite, mais la maniere standard est d'en he- 
riter a partir du module de classe Exporter. C'est ce que fait le code ci-dessus. 

Le module Exporter sert de classe de base pour les modules qui souhaitent etablir leur 
propres exportations. Curieusement, les modules orientes objet n'utilisent generale- 
ment pas Exporter, puisqu'ils n'exportent normalement rien (les appels de methodes 
n'ont pas besoin d'etre exportes). Toutefois, le module Exporter lui-meme est accessible 
de maniere orientee objet a cause du tableau @ISA que vous avez installe, comme dans 
notre exemple. Lorsqu'un autre programme ou qu'un autre module fait un use de votre 
module, vous utiliserez automatiquement la methode Exporter : : import par le biais de 
l'heritage. 



842 



Chapitre 32 — Modules standards 



Le tableau @EXPORT du module contient une liste de symboles (des fonctions et meme 
des variables) que le code appelant importe automatiquement avec une instruction use 
sans rien d'autre. Le tableau @EXP0RT_0K est compose des symboles qui peuvent etre im- 
portes si on les demande nommement. Le numero $VERSI0N est consulte si Finstruction 
use demande une version particuliere (ou plus recente) du module. Beaucoup, beau- 
coup d'autres fonctionnalites sont disponibles. Voir le chapitre 11, Modules, ainsi que la 
page de man en ligne du module Exporter. 



Fatal 

Le module Fatal fait echouer les fonctions plus spectaculairement. II remplace les fonc- 
tions qui normalement retournent faux en cas d'echec avec des sur-couches qui levent 
une exception si la veritable fonction renvoie faux. Ainsi, vous pouvez utiliser en toute 
surete ces fonctions sans tester explicitement leur valeur de retour a chaque appel. 

Les fonctions definies par l'utilisateur et les fonctions internes peuvent toutes etre en- 
robees, sauf les fonctions internes qui ne peuvent pas etre exprimees par des prototypes. 
Une tentative de supplanter une fonction interne non-enrobable leve une exception. 
Ceci inclut system, print, printf, exec, split, grep et map ou plus generiquement, tou- 
te FONC pour laquelle prototype "CORE : : FONC" renvoie faux, y compris la fonction pro- 
totype elle-meme. 

Si le symbole : void apparait dans la liste d'importation, les fonctions citees ensuite dans 
la liste se limitent a lever une exception lorsque la fonction est appelee dans un contexte 
void c'est-a-dire, lorsque la valeur renvoyee est ignoree. (Faites attention a la derniere 
instruction dans un sous-programme.) Par exemple : 

use Fatal qw(:void open close); 

# open proprement verifie, aucune exception n'est done levee en cas d'echec. 
if (open(HF, "< /rien_de_tel") { warn "aucun /rien de tel : $!"; } 

# close improprement verifie, une exception est done levee en cas d'echec. 
close HF; 
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use Fcntl; # Importe les constantes standard de fcntl. h. 

use Fcntl ": flock"; # Importe les constantes L0CK_*. 

use Fcntl ":seek"; # Importe SEEK_CUR, SEEK_SET et SEEKJND. 

use Fcntl ":mode"; # Importe les constantes de test de stat S_*. 

use Fcntl ":Fcompat"; # Importe les constantes F*. 

Le module Fcntl fournit des constantes a employer avec diverses fonctions internes de 
Perl. L'ensemble importe par defaut inclut des constantes comme F_GETFL et F_SETFL 
pour fcntl, SEEK_SET et SEEK_END pour seek et sysseek et 0_CREAT et 0_EXCL pour sy- 
sopen. Les tags d'importation supported incluent « : flock » pour acceder aux constan- 
tes L0CK_EX, L0CK_NB, L0CK_SH et LOCKJJN pour flock ; « :mode » pour aller chercher les 
constantes de sys/stat.h comme S_IRUSR et S_ISFIF0 ; « : seek » pour obtenir les trois ar- 
guments de seek et sysseek ; et « : Fcompat » pour avoir les symboles desuets commen- 
cant par un « F » mais pas par« F_ », comme FAPPEND, FASYNC et FNONBLOCK. Voir la 
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documentation en ligne du module Fcntl et la documentation de votre systeme d'ex- 
ploitation pour les appels systemes concerned, comme fcntl(2), lseek(2), open{2) etsfcrt(2). 

File::Basename 

use File: :Basename; 

$nom_complet = "/usr/local/src/perl-5.6.l.tar.gz"; 

$fichier = basename($nom_complet); 

# fichier= "perl-5.6.1.tar.gz" 

$rep = dirname($nom_complet); 
rep="/usr/local/src" 

($fichier,$rep,$ext) = fileparse($nom_complet, qr/\..*/); 

# rep="/usr/local/src/" f ichier="perl-5" ext=".6.1.tar.gz" 

($fichier,$rep,$ext) = fileparse($nom_complet, qr/\. [ A . ]*/); 

# rep="/usr/local/src/" fichier="perl-5.6.1.tar" ext=".gz" 

($fichier,$rep,$ext) = fileparse($nom_complet, qr/\.\D.*/); 

# rep="/usr/local/src/" fichier="perl-5.6.l" ext=" .tar.gz" 

($fichier,$rep,$bak) = fileparse("/tmp/fichier.bak", 

qi/~+%/, qr/\.(bak|orig|save)/) 

# rep="/tmp/" fichier="fichier" bak=".bak"; 

($fichier,$rep,$bak) = fileparse("/tmp/f ichier~", 

qr/~+$/, qr/\.(bak|orig|save)/) 

# rep="/tmp/" fichier="fichier" bak="~"; 

Le module File : : Basename fournit des fonctions pour decomposer les noms de chemin 
en leurs composants individuels. La fonction dirname sort la portion representant le re- 
pertoire et basename la portion ne representant pas le repertoire. La fonction plus ela- 
boree fileparse distingue dans le nom du chemin complet, le nom du repertoire, le 
nom du fichier et le suffixe ; vous devez fournir une liste d'expressions regulieres decri- 
vant les suffixes qui vous interessent. Les exemples ci-dessus illustrent comment le choix 
de motifs pour le suffixe affecte le resultat. Par defaut, ces fonctions analysent des noms 
de chemin selon les conventions natives de votre plate-forme. La fonction 
f ileparse_set_f stype selectionne les regies d'analyse pour une plate-forme differente, 
comme fileparse_set_fstype("VMS") pour analyser les noms utilisant les regies de 
VMS, meme lorsque Ton tourne sur des systemes non-VMS. 

File::Compare 

use File: :Compare; 

printf "fichier_A et fichier_B sont %s.\n", 
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compare("fichier_A","fichier_B") ? "differents" : "identiques"; 

use File: : Compare 'cmp'; 
sub arranger($) { 

my $ligne = $_[0]; 
for ($ligne) { 

s/\ A s+//; # Coupe les espaces au debut. 
s/\s+$//; # Coupe les espaces a la fin. 

} 

return uc($ligne); 

} 

if (not cmp("fichier_A", "fichier_B", 

sub {arranger $_[o] eq arranger $_[l]} ) { 
print "fichier_A et fichier_B sont a peu pres pareils.W; 

} 

Le module File: : Compare fournit une fonction, compare, qui compare le contenu des 
deux fichiers qu'on lui passe. Elle renvoie 0 si les fichiers contiennent les memes don- 
nees, 1 s'ils contiennent des donnees differentes et -1 si Ton a rencontre une erreur en 
accedant les fichiers cites. Si vous passez comme troisieme argument une reference de 
sous-programme, cette fonction est appelee repetitivement pour determiner si deux li- 
gnes sont equivalentes. Pour assurer la compatibilite avec le programme cmp(\), vous 
pouvez explicitement importer la fonction en tant que cmp. (Ceci n'affecte pas Fopera- 
teur binaire cmp.) 

File::Copy 

use File: :Copy; 

copy("/tmp/fichier_A", "/tmp/fichier_A.orig") or die "copie echouee : $!"; 
copy("/etc/motd", *STD0UT) or die "copie echouee : $!"; 

move("/tmp/fichier_A", "/tmp/fichier_A.orig") or die "deplacement echoue : $!"; 

use File::Copy qw/cp mv/; # Importe les noms Unix habituels. 

cp("/tmp/fichier_A" J "/tmp/fichier_A.orig") or die "copie echouee : $!"; 
mvC'/tmp/fichie^A", "/tmp/fichier_A.orig") or die "deplacement echoue : $!"; 

Le module File: :Copy exporte deux fonctions, copy et move, qui respectivement copie 
ou renomme leur premier argument vers leur second, de la meme maniere qu'un appel 
aux commandes Unix cp(\) et mv{l) (noms que vous pouvez utiliser si vous les importez 
explicitement). La fonction copy accepte egalement comme arguments des handles de 
fichiers. Ces fonctions renvoient vrai lorsqu'elle fonctionnent et faux lorsqu'elles 
echouent, en positionnant $! ($0S_ERR0R) de maniere appropriee. (Malheureusement, 
vous ne pouvez pas dire si quelque chose comme « Permission denied » s'applique au 
premier fichier ou au second.) Ces fonctions sont en quelque sorte un compromis entre 
le confort et la precision. Elles ne supportent pas les nombreuses options et optimisa- 
tions de cp{\) et mv{\), comme la copie recursive, la copie de sauvegarde automatique, 
la conservation des dates et heures originales et des informations sur les proprietaires 
des fichiers, ou la confirmation interactive. Si vous avez besoin de ces fonctionnalites, il 
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vaut certainement mieux appeler les versions de votre plate-forme pour ces comman- 
des. 2 Gardez bien a l'esprit que tous les systemes ne supportent pas les memes comman- 
des ou n'emploient pas les memes options pour ces commandes. 

system("cp -R -pi /tmp/repl /tmp/rep2) == 0 

or die "le statut de la commande externe cp est $?"; 



use File: :Find; 

# Affiche tous les repertoires en-dessous du repertoire courant. 
find sub { print "$File: :Find: :name\n" if -d }, 

# Calcule l'espace total utilise par les fichiers des repertoires listes. 
@reps = @ARGV ? @ARGV : ('.'); 

my $tot = 0; 

find sub { $tot += -s }, (Sreps; 

print "(Sreps contiennent $tot octets\n"j 

# Modifie le comportement par defaut pour traverser les liens 

# symboliques et visiter les sous-repertoires en premier 
find { wanted => \&ma_fonction, follow => 1, bydepth=>l }, 

La fonction find du module File: :Find descend recursivement dans des repertoires. 
Son premier argument doit etre une reference a une fonction et tous les arguments sui- 
vants doivent etre des repertoires. La fonction est appelee pour chaque fichier des reper- 
toires listes. A l'interieur de cette fonction, la variable $_ est positionnee avec le nom de 
base du fichier actuellement visite et le repertoire de travail courant du processus est par 
defaut mis a ce repertoire. La variable de paquetage $File : : Find : : name est le nom de 
chemin complet du fichier visite. Une autre convention d'appel prend comme premier 
argument une reference a un hachage contenant des specifications d'options, incluant 
« wanted », « bydepth », « follow », « follow_fast », « follow_skip », « no_chdir », 
« untaint », « untaint_pattern » et « untaint_skip », comme le detaille complete- 
ment la documentation en ligne. Ce module est egalement utilise par le programme de 
conversion standard fmd2perl{\) qui vient avec la distribution Perl. 



use File:: Glob qw(:glob cshglob); 



2. Ou aller chercher les versions PPT si votre plate-forme est un defi pour ces outils. N.d.T. : Perl 
Power Tools : The Unix Reconstruction Project, un projet dont le but avoue est : « Notre objectif est, 
de maniere assez simple, de reimplementer le jeu de commandes classiques Unix en Perl pur, et 
de nous amuser autant que possible en faisant cela. » . 



Filer.Find 



Filer.Glob 



use File::Glob J :glob'; 
(Sliste = <*. [Cchy]>; 



# Supplante le glob interne. 

# Utilise maintenant le glob POSIX, pas le 

# glob csh. 
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@sources = bsd_glob("*.{C,c,h,y,pm,xs}", GLOBCSH); 
^sources = csh_glob("*.{C,c,h,y,pm,xs}"); # (idem) 

use File::Clob J :glob'; 

# appelle glob avec des arguments supplementaires 
$rep_maison = bsd_glob('~hackerjr' , GLOBTILDE | CLOBJRR); 
if (GL0B_ERR0R) { 

# Une erreur s'est produite en developpant le repertoire maison 

} 

La fonction bsd_glob du module File : : Glob implemente la routine glob(3) de la librai- 
rie C. Un second argument facultatif contient des options gouvernant des proprietes 
supplementaires de correspondances. Le tag d'importation : glob importe a la fois la 
fonction et les options necessaires. 

Le module implemente egalement une fonction csh_glob. C'est elle que Foperateur in- 
terne de Perl glob et foperateur de globalisation de fichiers CLOBPAT appellent reelle- 
ment. Appeler csh_glob revient (en grande partie) a appeler bsd_glob de cette 
maniere : 

bsd_glob(@_ ? $_[0] : $_, 

GLOB_BRACE | GL0B_N0MAGIC | GLOBQUOTE | GLOB_TILDE); 

Si vous importez le tag :glob, tous les appels aux operateurs internes de globalisation 
de fichiers dans le paquetage courant appelleront alors reellement la fonction du mo- 
dule bsd_glob a la place de la fonction csh_glob. Une raison pour laquelle vous vou- 
driez faire cela, bien que bsd_glob s'occupe de motifs comprenant des espaces, est que 
csh_glob s'en occupe d'une maniere, heu, historique. Les anciens scripts ecriraient <* . c 
*.h> pour globaliser les deux motifs. De toute facon, aucune des fonctions n'est genee 
par des espaces dans les veritables noms de fichiers. 

La fonction bsd_glob prend un argument contenant le motif de globalisation de fi- 
chiers (et pas un motif d'expression reguliere) plus un argument facultatif pour les op- 
tions. Les noms de fichiers commencant par un point ne correspondent pas a moins de 
le demander specifiquement. La valeur de retour est influencee par les options du se- 
cond argument, qui doivent etre des bits joints entre eux par des OU : 3 

GLOB_BRACE 

Traite en amont la chaine pour developper les chaines {motif , motif , . . . } comme 
csh(l) le ferait. Le motif {} n'est pas developpe pour des raisons historiques, surtout 
pour faciliter la saisie des motifs de find{\). 

GL0B_CSH 

Synonyme de GLOB_BRACE | GLOBJIOMAGIC | GL0B_0U0TE | GLOB_TILDE 
GLOBJRR 

Renvoie une erreur lorsque la fonction bsd_glob rencontre un repertoire qu'elle ne 
peut ouvrir ou lire. D'ordinaire, bsd_glob saute les erreurs pour rechercher d'autres 
correspondances. 



3. A cause des restrictions de syntaxe dans l'operateur interne glob, il se peut que vous deviez 
appeler la fonction en tant que bsd_glob si vous voulez lui passer le second argument. 
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CLOB_MARK 

Ajoute un slash a la fin des repertoires. 
CL0B_N0CASE 

Par defaut, les noms de fichiers sont sensibles a la casse (majuscules/minuscules) ; 
cette options fait que bsd_glob ignore les differences de casse. (Mais voir ci-dessous 
les exceptions sur les systemes a la MS-DOS). 

GL0B_N0CHECK 

Si le motif ne correspond a aucun nom de chemin, alors bsd_glob renvoie une liste 
uniquement constitute du motif, comme le fait /bin/sh. Si l'option GL0B_0U0TE est 
positionnee, les consequences qu'elle entraine sont presentes dans le motif renvoye. 

CL0B_N0MACIC 

Idem que CL0B_N0CHECK mais le motif n'est renvoye que s'il ne contient aucun des 
caracteres speciaux *, ? ou [. NOMAGIC est la pour simplifier l'implementation du 
comportement historique de globalisation de csft(l) et ne devrait probablement pas 
etre utilise ailleurs. 

CL0B_N0S0RT 

Par defaut, les noms de chemins sont tries dans un ordre croissant (en utilisant les 
comparaisons de caracteres habituelles, sans respecter les valeurs des locales). Cette 
option evite ce tri avec comme resultat une legere amelioration de la vitesse. 

CL0B_0U0TE 

Utilise le caractere antislash \ pour les protections : chaque occurrence dans le 
motif d'un antislash suivi par un caractere est remplacee par ce caractere, evitant les 
interpretations speciales du caractere en question. (Mais voir ci-dessous les excep- 
tions sur les systemes a la MS-DOS). 

GLOB_TILDE 

Autorise l'emploi de motifs dont le premier composant du chemin est ~UTILISA- 
TEUR. Si UTILISATEUR est omis, le tilde lui-meme (ou suivi par un slash) represente 
le repertoire maison de l'utilisateur courant. 

La fonction bsd_glob renvoie une liste (qui peut etre vide) des chemins correspondants, 
cette liste pouvant devenir marquee si cela importe a votre programme. En cas d'erreur, 
GL0B_ERR0R sera vrai et $! ($0S_ERR0R)sera positionnee avec l'erreur systeme standard. 
II est granti que GL0B_ERR0R sera faux s'il ne se passe aucune erreur, et de valoir soit 
GLOB_ABEND, sinon GL0B_N0SPACE. (GLOB_ABEND signifie que la fonction bsd_glob s'est ar- 
retee a cause d'une erreur et GL0B_N0SPACE a cause d'un manque de memoire.) Si 
bsd_glob a deja trouve des chemins correspondant lorsque l'erreur se produit, elle ren- 
voie la liste des noms de fichiers trouves jusque la mais positionne aussi GL0B_ERR0R. Re- 
marquez que cette implementation de bsd_glob differe de la plupart des autres en ce 
qu'elle ne considere pas ENOENT et ENOTDIR comme des conditions d'arret sur erreur. A 
la place, elle poursuit son traitement malgre ces erreurs, sauf si l'option GL0B_ERR est po- 
sitionnee. 

Si aucune option n'est donnee, les comportements par defaut de votre systeme sont res- 
pectes, c'est-a-dire que les noms de fichiers qui different seulement par leur casse seront 
confondus sur VMS, OS/2, les vieux Mac OS (mais pas Mac OS X) et les systemes Micro- 
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soft (mais pas lorsque Perl a ete compile avec Cygwin). Si vous ne donnez aucune option 
et que vous voulez toujours que ce comportement s'applique, vous devez alors inclure 
GL0B_N0CASE dans les options. Quelque soit le systeme sur lequel vous etes, vous pouvez 
modifier votre comportement par defaut en important a Favance les options : case ou 
:nocase. 

Sur les systemes a la MS-DOS, l'antislash est un caractere separateur de repertoires vali- 
de. 4 Dans ce cas, l'emploi d'un antislash comme caractere de protection (via 
GL0B_0U0TE) interfere avec l'emploi de l'antislash en tant que separateur de repertoires. 
La meilleure solution (la plus simple et la plus portable) est d'utiliser des slashs comme 
separateurs de repertoires, des antislashs pour les protections. De toute facon, cela n'a 
rien a voir avec les attentes de certains utilisateurs, ainsi les antislashs (sous GL0B_0U0TE) 
ne protegent que les metacaracteres de globalisation [,],{,}, -,~et\ lui-meme.Tous 
les autres antislashs sont passes inchanges, si vous parvenez a en avoir avec le propre me- 
canisme de Perl pour la protection par antislashs dans les chaines. Cela peut prendre jus- 
qu'a quatre antislashs pour finalement correspondre a un seul dans le systeme de 
fichier. Ceci est tellement completement delirant que meme les utilisateurs des syste- 
mes a la MS-DOS devraient serieusement penser a employer des slashs. Si vous voulez 
vraiment utiliser des antislashs, jetez un oeil au module standard File : : DosGlob qui est 
plus susceptible de correspondre a vos gouts que la globalisation de fichiers a la mode 
Unix. 

File::Spec 

use File: :Spec; # style oriente objet 

$chemin = File: :Spec->catfile("sous_rep", "fichier"); 

# 'sousrep/fichier' sur Unix, 0S2 ou Mac OS X 

# 'sous_rep: fichier' sur les (vieux) Macs d'Apple 

# 'sous_rep\fichier' sur Microsoft 

$chemin = File: :Spec->catfile("", "repl", "rep2", "fichier"); 

# '/repl/rep2/fichier' sur Unix, 0S2 ou Mac OS X 

# ' :repl:rep2 : fichier' sur les (vieux) Macs d'Apple 

# ■'\repl\rep2\fichier'' sur Microsoft 

use File: :Spec: :Unix; 

$chemin = File: :Spec->catfile("sous_rep", "fichier"); 

# 'sousrep/fichier' (meme si execute sur des systemes non-Unix) 

use File: :Spec: :Mac; 

$chemin = File: :Spec->catfile("sous_rep", "fichier"); 

# 'sousrep: fichier' 

use File: :Spec: :Win32; 



4. Bien que techniquement, le slash aussi — du moins aussi longtemps que cela concerne les 
noyaux et les appels systemes ; les commandes shell sont remarquablement moins bien eclairees. 
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$chemin = File: :Spec->catfile("sous_rep", "fichier"); 
# J sous_rep\f ichier' 

# Utilise plutot l'interface fonctionnelle. 

use File: :Spec: functions; 

$chemin = catfile("sous_rep", "fichier"); 

La famille de modules File: : Spec vous permet de construire des chemins utilisant des 
repertoires et des noms de fichiers sans coder en dur les separateurs de repertoires spe- 
cifiques aux plates-formes. Les systemes supported incluent Unix, VMS, Mac et Win32. 
Ces modules offrent tous une methode de classe catf ile qui concatene chaque compo- 
sant de chemin en utilisant le separateur de chemin specifique a la plate-forme. Le mo- 
dule File: :Spec renvoie des resultats differents selon votre plate-forme courante. Les 
autres renvoient des resultat specifique a la plate-forme en question. Le module Fi- 
le: :Spec: : Functions fournit une interface fonctionnelle. 

Filer.stat 

use File: :stat; 

$st = stat($f ichier) or die "stat de $fichier impossible : $!"; 
if ($st->mode & 0111 and $st->nlink > l) { 

print "$f ichier est executable et possede plusieurs liens\n"; 

} 

use File::stat " :FIELDS"; 

stat($f ichier) or die "stat de $fichier impossible : $!"; 

if ($st_mode & 0111 and $st_nlink > l) { 

print "$f ichier est executable et possede plusieurs liens\n"; 

} 

@infos_stat = CORE: :stat($f ichier); # Utilise la fonction interne, 

# meme si elle est supplantee 

Le module File : : stat fournit une interface methode aux fonctions internes Perl stat 
et lstat en les remplacant par des versions renvoyant une objet File: :stat (ou undef 
en cas d'echec). Cet objet possede des methodes nominees de maniere a renvoyer le 
champ de la structure du meme nom depuis l'appel systeme habituel stat(2) ; il s'agit de 
dev, ino, mode, nlink, uid, gid, rdev, size, atime, mtime, ctime, blksize et blocks. Vous 
pouvez egalement importer les champs de la structure dans votre propre espace de 
noms en tant que variables ordinairex en utilisant le tag d'importation « : FIELDS ». 
(Les operateurs internes stat et lstat continuent a etre supplantes.) Ces champs se pre- 
sentent comme des variables scalaires avec un « st_ » au debut du nom du champ. 
C'est-a-dire que la variable $st_dev correspond a la methode $st->dev. 



File::Temp 

use File::Temp qw(tempfile tempdir); 

$rep = tempdir (CLEANUP => l); 

($hf, $f ichier) = tempf ile(DIR => $rep); 



o 
a. 
c 
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($hf, $fichier) = tempf ile($exemple, DIR => $rep); 
($hf, $fichier) = tempfile($exemple, SUFFIX => ".data"); 
$hf = tempf ile(); 

use File::Temp ' rrnktemp- 1 ; 

($hf, $fichier) = mkstemp("fic_tmpXXXXX"); 

($hf, $fichier) = mkstemps("fic_tmpXXXXX" , $suffixe); 

$rep_tmp = mkdtemp($exemple); 

$fichier_non_ouvert = mktemp($exemple); 

Nouveaute dans la version 5.6.1 de Perl, le module File: :Temp fournit des fonctions 
pratiques pour creer et ouvrir de maniere sure des fichiers temporaires. II vaut mieux 
utiliser ce module qu'essayer de choisir vous-meme un fichier temporaire. Sinon, vous 
tomberez dans les memes pieges que tout le monde avant vous. Ce module vous protege 
aussi bien des situations de concurrence (race conditions) que du danger d'employer des 
repertoires oil d'autres peuvent ecrire ; voir le chapitre 23, Securite. La fonction tempf i- 
le renvoie a la fois un handle de fichier et un nom de fichier. Le plus sur est d'utiliser 
ce qui est deja ouvert et d'ignorer completement le nom de fichier (excepte peut-etre 
pour les messages d'erreurs). Une fois que le fichier est ferme, il est automatiquement 
supprime. Pour assurer une compatibilite avec la bibliotheque C, le tag d'importation 
:mktemp donne un acces aux fonctions dont les noms sont familiers aux programmeurs 
C, mais s'il vous plait, souvenez-vous que les noms de fichiers sont toujours moins surs 
que les handles de fichiers. 

FileHandle 

use FileHandle; 

$hf = new FileHandle; 

if ($hf->open("< fichier")) { 

print $ligne while defined($ligne = $hf->getline); 

$hf->close; 

} 

$pos = $hf->getpos; # comme tell() 
$hf->setpos($pos); # comme seek() 

($hf_lec, $hf_ecr) = FileHandle: :pipe(); 

autoflush STDOUT, 1; 

Le module FileHandle sert surtout de mecanisme pour dissimuler les variables de Perl 
contenant des ponctuations sous des appellations plus longues, davantage dans le style 
oriente objet. II est fourni pour assurer une compatibilite avec des versions anterieures 
mais maintenant il s'agit veritablement d'un frontal vers plusieurs modules plus speci- 
fiques, comme 10: : Handle et 10: :File. 5 Sameilleure propriete est Faeces de bas niveau 



5. Comme il charge beaucoup de code, ce module vous coute environ un mega-octet en 
memoire. 
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qu'il fournit vers certaine fonctions rares de la bibliotheque C (clearerr(3), fgetpos(3), 
fsetpos{3) et setvbuf{3)). 



Variable 


Methode 


$1 
i 


autof lush 
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$% 


format page number 


$ = 


format lines per page 


$" 


format lines left 


$~ 


format name 


$ A 


format top name 


$: 


format line break characters 


$ A L 


format formfeed 



Au lieu d'ecrire : 

$hfs = select (HANDLE ); 
$~ = 'UnFormat'; 

$1 = i; 
select($hfs); 

vous pouvez juste ecrire : 

use FileHandle; 

Handle- >f ormat_name( ' UnFormat ' ) ; 
Ha/idJe->autoflush(l); 

Actuellement, trois methodes (output_f ield_separator, output_record_separator et 
input_record_separator) ne font que pretendre etre des methodes par handle : les po- 
sitionner sur un handle affecte tous les handles de fichiers. Elles sont ainsi seulement 
supportees en tant que methodes de classes, pas en tant que methodes par handle de 
fichier. Cette restriction sera peut-etre abandonnee un jour. 

Pour obtenir un handle de fichier de portee lexicale, au lieu d'utiliser l'autovivifiation 
de handle de fichier : 

open my $hf, "< un_fichier" 

or die "impossible d'ouvrir un_fichier : $!"; 

on peut ecrire : 

use FileHandle; 

my $hf = FileHandle->new("< un_fichier") 

or die "impossible d'ouvrir un_fichier : $!"; 

FileHandle herite de 10: :File, qui lui-meme herite de 10: :Handle et 10: :Seekable. 
Les fonctionnalites du module sont virtuellement toutes accessibles plus efficacement 
via les appels purs et basiques de Perl, sauf pour les suivants, qui peuvent ne pas tous 
etre implementes sur les plates-formes non-Unix : 
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HANDLE ->blocking(FXP/?) 

Appele avec un argument, active les entrees/sorties non-bloquantes si l'argument 
est faux et desactive les entrees/sorties non-bloquantes (c'est-a-dire active les 
entrees/sorties bloquantes) s'il est vrai. La methode renvoie la precedente valeur 
positionnee (ce qui est toujours le comportement actuel si aucun argument n'est 
donne). En cas d'erreur, blocking positionne $! et renvoie undef. Ceci pourrait etre 
accompli avec f cntl directement mais l'interface FileHandle est plus simple a utili- 
ses 

HANDLE- >clearerr 

Appelle la fonction clearerr(3) de la bibliotheque C pour efface les indicateurs inter- 
nes du handle pour la fin de fichier et le statut d'erreur. 

HANDLE- >error 

Appelle la fonction ferror(3) de la bibliotheque C pour tester l'indicateur d'erreur 
pour le handle donne, en renvoyant si cet indicateur interne est positionne ou non. 
L'indicateur d'erreur ne peut etre reinitialise fiablement que via la methode clea- 
rerr. (Certains systemes le reinitialisent egalement en appelant l'operateur seek.) 

HMD/.E- >formline (IMAGE, LISTE) 

Cela revient au meme que de sauvegarder l'ancienne variable d'accumulateur 
($ A A), d'appeler la fonction f ormline avec VIMAGE et la LISTE donnees, d'afficher le 
contenu resultant de l'accumulateur vers le handle donne et enfin de restaurer 
Paccumulateur original. Par exemple, voici comment afficher une variable repre- 
sentant un texte long en allant a la ligne a la colonne 72 : 
use FileHandle; 

STDOUT->formline(" A " . ("<" x 72) . "~~\n", $texte_long); 
HANDLE- >getpos 

Appelle la fonction getpos(3) de la bibliotheque C, offrant ainsi une interface alter- 
native a tell. Sur certains systemes (non-Unix), la valeur renvoyee peut etre un 
objet complexe et getpos et setpos peuvent etre la seul maniere de repositionner 
de maniere portable un flux de texte. 

HANDL E- > new_tmpf ile 

Appelle la fonction tmpfile(3) de la bibliotheque C pour creer un nouveau fichier 
temporaire ouvert en mode lecture-ecriture et renvoie un handle sur ce flux. Sur 
les systemes ou c'est possible, le fichier temporaire est anonyme, c'est-a-dire qu'il est 
supprime avec unlink apres sa creation tout en restant ouvert. Vous devez utiliser 
cette fonction ou POSIX: :tmpnam comme decrit dans le module POSIX pour creer de 
maniere sure un fichier temporaire sans vous exposer aux problemes de securites 
annexes mais neanmoins serieux avec les situations de concurrence (N.d.T. : race 
conditions). Depuis la version 5.6.1 de Perl, le module File: :Temp est maintenant 
l'interface recommandee. 

HANDLE->setbuf (TAMPON) 

Appelle la fonction setbuf (3) de la bibliotheque C avec la variable TAMPON donnee. 
La methode passe undef pour indiquer une sortie qui n'utilisent pas le mecanisme 
de tampon. Une variable utilisee comme tampon par setbuf ou setvbuf ne doit pas 
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etre modifiee d'aucune maniere jusqu'a ce que le handle soit ferine ou jusqu'a ce que 
la fonction setbuf ou setvbuf soit appelee a nouveau. Sinon il peut en resulter 
une corruption de memoire qui vous ferait de la peine. 

HANDLE->setpos(EXPR) 

Appelle la fonction fsetpos(3) de la bibliotheque C, offrant ainsi une autre interface 
a seek. L'argument ne doit etre qu'une valeur correcte renvoyee par getpos, comme 
decrit precedemment. 

HANDLE->setvbuf (TAMPON, TYPE, TAILLE) 

Appelle la fonction setvbuf (3) de la bibliotheque C avec le TAMPON donne. Les cons- 
tantes standards de la bibliotheque C _I0NBF (sans utilisation d'un tampon), _I0LBF 
(tampon vide ligne par ligne) et _I0FBF (mecanisme complet de tampon) sont dis- 
ponibles pour le champ TYPE si elles sont explicitement importees. Voir la mise en 
garde dans setbuf. 

HANDL E-> sync 

Appelle la fonction fsync(3) de la bibliotheque C pour synchroniser un fichier dans 
un etat en-memoire vers le support physique. Remarquez que sync n'agit pas sur le 
handle mais sur le descripteur de fichier, toute donnee conservee dans les tampons 
ne sera done pas synchronised a moins que le tampon ne soit tout d'abord vide 
(NAT. -.flushed). 

HMD/.£->untaint 

Marque le handle de fichier ou de repertoire en lui fournissant une donnee non- 
marquee. Lorsque Ton tourne en mode marque (voir le chapitre 23), les donnees 
lues depuis des fichiers externes sont considered comme etant indignes de con- 
fiance. N'invoquez pas cette methode aveuglement : vous court-circuiteriez les 
meilleures tentatives de Perl pour vous proteger de vous-meme. 

Getopt::Long 

Si votre programme fait : 
use Getopt: :Long; 

GetOptions("verbeux" => \$verbeux, 
"debogage" => \$debogage, 
"sortie=s" => \$sortie); 

il peut etre appele ainsi depuis la ligne de commande : 

% prog --verbeux autres arguments ici 

% prog --debogage autres arguments ici 

% prog -v -d autres arguments ici 

% prog --sortie=un_fichier autres arguments ici 

% prog -s un_fichier autres arguments ici 

Le module Getopt: : Long fournit une fonction GetOptions pour traiter les options de 
la ligne de commande avec des noms assez longs. II inclut un support pour des choses 
comme les options en abrege, les arguments types comme booleen, chaine, entier ou a 
virgule f lottante, les variables de tableaux pour les options repetees, les routines de va- 
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lidation definies par l'utilisateur, le traitement conforme a POSIX ou conforme au style 
FSF, les options insensibles a la casse et le regroupement traditionnel des options courtes 
pour ne citer qu'un echantillon de la corne d'abondance de ses fonctionnalites. Si ce 
module en fait trop, pensez au module plus ordinaire Cetopt : : Std decrit plus loin. Si 
ce module n'en fait pas assez, regardez le module de CPAN Cetopt : : Declare qui offre 
une syntaxe plus declarative pour specifier les options. 

Getopt::Std 

use Getopt: : Std; 
Vous pouvez utiliser getopt et getopts avec des variables globales : 
out ($opt_o, $opt_i, $opt_f); 

getopt ( J oi-P); # -o, -i et -f prennent tous des arguments. 

# Positionne les variables globales $opt_*. 
getopts('oif : '); # Maintenant -o et -i sont booleens ; -f prend un arg. 

# Positionne toujours les variables globales $opt_* 

# comme effet de bord. 

Ou vous pouvez les utiliser avec un hachage prive pour les options : 

my %opts; # Nous placerons les resultats ici. 

getoptCoif ' , \%opts); # Tous les trois prennent toujours un argument. 
getopts('oif : ' , \%opts); # Maintenant -o et -i sont des booleens 

# et seul -f prend un argument. 

Le module Getopt: :Std fournit deux fonctions, getopt et getopts, pour vous aider a 
analyser les arguments de la ligne de commande dans le cas d'options sur un seul carac- 
tere. Des deux fonctions, getopts est la plus utile car elle vous laisse specifier que certai- 
nes options prennent un argument ; sinon, on s'attend a trouver une option booleenne. 
Le regroupement d'options standards est supporte. L'ordre ne compte pas, ainsi les op- 
tions ne prenant pas d'arguments peuvent etre regroupees ensemble. Les options qui 
prennent un argument doivent etre les dernieres d'un groupe ou etre specifiee a part et 
leur argument doit venir soit immediatement apres l'option dans la meme chaine, soit 
comme l'argument suivant du programme. Etant donne l'exemple d'utilisation de ge- 
topts ci-dessus, voici des appels equivalents : 

% prog -o -i -f FIC_TEMP autres arguments ici 

% prog -o -if FIC_TEMP autres arguments ici 

% prog -io -fFIC_TEMP autres arguments ici 

% prog -iofFICTEMP autres arguments ici 

% prog -oifFICTEMP autres arguments ici 

WrSocket 

use 10: : Socket; 

En tant que client : 

$socket = new 10: : Socket : :INET (PeerAddr => $hote_distant, 

PeerPort => $port_distant, 
Proto => "tcp", 
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Type => SOCKSTREAM) 
or die "Connexion impossible vers $hote_distant:port_distant : $!\n"; 

# Ou utilisez l' interface plus simple a un seul argument. 
$socket = 10: :Socket: :INET->new("$hote_distant:$port_distant, "); 

# "localhost:80", par exemple. 

print $socket "donnee\n"; 
$ligne = <$socket>; 

En tant que serveur : 

$serveur = 10: : Socket : :INET->new(LocalPort => port_serveur, 

Type => SOCKSTREAM, 
Reuse => 1, 

Listen => 10) # ou SOMAXCONN 
or die "Impossible d'etre un serveur TCP sur le port 
$port_serveur : $!\n"; 

while ($client = $serveur->accept()) { 
# $client est la nouvelle connexion 
$requete = <$client>; 
print $client "reponse\n"; 
close $client; 

} 

# Simple fonction de connexion TCP renvoyant un handle de fichier 

# pour utiliser dans les programmes clients simples, 
sub connex_tcp { 

my ($hote, $service) = @_; 
require 10: :Socket; 

return 10: : Socket : :INET->new( join ":", $hote, $service); 

} 

my $hf = connex_tcp("localhost, "smtp"); # avec un scalaire 
local *HF = connex_tcp("localhost, "smtp"); # avec un handle 

Le module 10: : Socket fournit une approche de plus haut niveau pour la gestion des 
sockets que le module de base Socket. Vous pouvez l'utiliser dans un style oriente objet, 
bien que ce ne soit pas obligatoire, car les valeurs renvoyees sont des handles de fichiers 
reguliers et peuvent etre utilisees en tant que telles, comme le montre la fonction 
connex_tcp dans l'exemple ci-dessus. Ce module herite ses methodes de 10: : Handle et 
fait lui-meme un require de 10: : Socket: :INET et 10: : Socket: :UNIX. Voir la descrip- 
tion du module FileHandle pour d'autres fonctionnalites interessantes. Voir le chapitre 
16 pour une description de l'utilisation des sockets. 

IPC::Open2 

use IPC: :0pen2; 



local(*SA_S0RTIE, *S0N_ENTREE); 



# Cree les handles locaux si besoin. 
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$pid_fils = open2(*SA_S0RTIE, *SON_ENTREE, $programme, @args) 
or die "Impossible d'ouvrir un pipe vers $programme : $!"; 
print SON_ENTREE "Voici votre entree\n"; 
$sa_sortie = <SA_S0RTIE>; 
close(SA_SORTIE); 
close(SONENTREE); 
waitpid($pid_f ils, 0); 

La seule fonction exportee, open2, du module IPC: :0pen2 demarre un autre program- 
me et offre un acces a la fois en lecture et en ecriture a cette commande. Les deux pre- 
miers arguments doivent etre des handles de fichiers valides (ou alors des variables vides 
dans lesquelles seront places les handles de fichiers autogeneres). Les arguments res- 
tants sont le programme plus ses arguments, qui, s'ils sont passes separement, ne seront 
pas interpretes par le shell. Ce module ne recolte pas le processus fils apres sa mort. A 
part les programmes courts ou il reste acceptable de laisser le systeme d'exploitation ge- 
rer cela, vous aurez besoin de le faire vous-memes. Cela se resume normalement a ap- 
peler waitpid $pid , 0 lorsque vous en avez finit avec ce processus fils. Ne pas faire ceci 
entraine l'accumulation de processus defunts (« zombies »). 

En pratique, ce module ne fonctionne pas bien avec beaucoup de programmes a cause 
de la maniere dont marche le vidage de tampon dans la bibliotheque d'entrees/sorties 
standard en C. Si vous controlez le code source des deux programmes, vous pouvez tou- 
tefois contourner facilement cette restriction en forcant le vidage (flushing) de vos tam- 
pons de sortie plus frequemment que par defaut. Si ce n'est pas le cas, les programmes 
peuvent etre ennuyeusement avares dans leur accumulation de donnees en sortie. Un 
autre piege potentiel est le verrou mortel (deadlock) : si les deux processus sont en train 
de lire au meme moment et qu'aucun n'ecrit, alors votre programme se bloquera. Voir 
le chapitre 16 pour une discussion approfondie. 



IPC::Open3 

use IPC: :0pen3; 

local(*SON_ENTREE, *SA_S0RTIE, *SON_ERREUR); 



$pid_fils = open3(*S0N_ENTREE, *SA_S0RTIE, *SON_ERREUR, $cmd, @args); 
print SON_ENTREE "trucs\n"; 

close(SONENTREE); # Donne une fin de fichier au fils. 

@lignes_sortie = <SA_S0RTIE>; # Lit jusqu'a EOF. 

(5>lignes_erreur = <SON_ERREUR>; # XXX : blocage potentiel si enorme 

print "STDOUTjV, |5)lignes_sortie, "\n"; 

print "STDERR:\n"j |81ignes_erreur, "\n"; 

close SA_S0RTIE; 

close SONERREUR; 

waitpid($pid_f ils, 0); 

if ($?) { 

print "Ce fils s'est termine avec comme statut d'attente $?_n"; 

} 

Le module IPC: :0pen3 fonctionne comme IPC: :0pen2 (ce dernier est implemente dans 
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les termes du premier), excepte que open3 donne acces aux handles d'entree standard, 
de sortie standard et de sortie d'erreurs standard du programme que vous lancez. Les 
memes precautions qu'avec open2 (voir Fentree precedente) s'appliquent, plus quelques 
autres. Au lieu de passer le handle pour la lecture en premier et celui pour Fecriture en 
second, cette fois-ci c'est l'inverse. De plus, avec open3, le danger de verrous mortels (dea- 
dlocks) est encore plus grand qu'avant. Si vous essayez de lire apres la fin de fichier sur 
Fun des handles de sortie du fils, mais que pendant ce temps il y a beaucoup de trafic 
en sortie sur Fautre handle, le processus pair semble se bloquer. Utilisez soit la forme a 
quatre arguments de select, soit le module 10: : Select pour contourner cela. Voir le 
chapitre 16 pour plus de details. 

Math::BigInt 

use Math: : Biglnt; 

$i = Math: :BigInt->new($chaine); 

use Math::BigInt J :constant'; 
print 2**200; 

Ceci affiche : 

+1606938044258990275541962092341162602522202993782792835301376 

Le module Math : : Biglnt fournit des objets qui representent des entiers avec une preci- 
sion arbitraire et des operateurs arithmetiques surcharges. Creez ces objets en utilisant 
le constructeur new ou, dans une portee lexicale, en important la valeur speciale 
« : constant », apres laquelle tous les litteraux numeriques jusqu'a la fin de cette portee 
lexicale seront traites comme des objets Math : : Biglnt. Tous les operateurs standards sur 
les entiers sont implementes, y compris (depuis la version 5.6 de Perl) les operateurs lo- 
giques de bits. Dans Fimplementation actuelle, ce module n'est pas ce que vous pouvez 
appeler d'une rapidite fulgurante mais cela pourrait etre le cas dans Favenir. (Nous 
aimerions voir a quelle vitesse vous calculez de tete 2**200.) 

Math::Complex 

use Math: :Complex; 

$z = Math: :Complex->make(5, 6); 

$z = cplx(5, 6); # idem mais plus court. 

$t = 4 - 3*i + $z; # effectue des operations complexes standard 

print "$t\n"; # affiche 9+3i 

print sqrt(-9), "\n"; # affiche 3i 

Le module Math : : Complex fournit des objets representant des nombres complexes avec 
des operateurs surcharges. Ce sont des nombres avec une partie reelle et une partie ima- 
ginaire comme ceux qui satisfont les racines paires de nombres negatifs, comme montre 
ci-dessus. A cote des operateurs arithmetiques, nombre de fonctions internes mathema- 
tiques sont egalement supplantees par des versions qui connaissent les nombres com- 
plexes, incluant abs, log, sqrt, sin, cos et atan2. D'autres fonctions fournies sont Re et 
Im pour donner les parties reelles et imaginaires des arguments complexes, plus une bat- 
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terie complete de fonctions trigonometriques etendues, comme tan, asin, acos, sinh, 
cosh et tanh. Le module exporte egalement la constante i, qui, comme vous pouvez 
Fimaginer, contient la valeur de i ; c'est-a-dire, la racine carree de -1. 

Math::Trig 

use Math: :Trig; 

$x = tan(0.9); 
$y = acos(3.7); 
$z = asin(2.4); 

$pi_sur_deux = pi/2; 

$rad = deg2rad(l20); 

Perl ne definit lui-meme que trois fonctions trigonometriques : sin, cos et atan2. Le 
module Math : : Trig les supplante avec des versions plus agreables et fournit toutes les 
autres fonctions trigos, incluant tan, esc, cosec, sec, cot, cotan, asin, acos, atan, sinh, 
cosh, tanh et beaucoup d'autres. De plus, la constante pi est definie, tout comme les 
fonctions de conversion comme deg2rad et grad2rad. Un support est fourni pour les 
systemes de coordonnees cartesiennes, cylindriques ou spheriques. Ce module fait un 
usage implicite de Math : : Complex si besoin est (et vice-versa) pour les calculs necessitant 
des nombres imaginaires. 

Net::hostent 

use Socket; 

use Net: :hostent; 

print inet_ntoa(gethost("www.perl.com")->addr); # affiche 208.201.239.50 
printf "%vd", gethost("www.perl.com")->addr; # idem 

print gethost("127.0.0.1")->name; # affiche localhost 

use Net::hostent ': FIELDS'; 
if (gethost($nom_ou_nombre)) { 
print "le nom est $h_name\n"; 
print "les alias sont $h_aliases\n"; 
print "les adresses sont 

join ", " => map { inet_ntoa($_) } @h_addr_list; 
} ~ 
Les exportations par defaut de ce module supplantent les fonctions intrinseques 
gethostbyname et gethostbyaddr, en les remplacant avec des versions qui renvoient un 
objet Net: :hostent (ou undef en cas d'echec). Cet objet possede des methodes acces- 
seurs d'attributs qui renvoient des champs nommes comme ceux de la structure struct 
hostent de la bibliotheque C definie dans netdb.h : name, aliases, addrtype, length ou 
addr_list. Les methodes aliases et addr_list renvoient des references de tableaux ; 
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les autres renvoient des scalaires. La fonction gethost est un frontal qui fait suivre un 
argument numerique a gethostbyaddr par le biais de la fonction Socket : : inet_aton et 
le reste a get host byname. Comme avec les autres modules semi-pragmatiques qui sup- 
plantent des fonctions internes renvoyant des listes, si vous importez le tag « : FIELDS », 
vous pouvez acceder a des variables de paquetages scalaires ou tabulaires par le meme 
nom que les appels de methodes prefixes par « h_ ». Les fonctions intrinseques sont 
quand meme supplantees. 

POSIX 

use POSIX; 

# Arrondit des nombres a virgule flottante a l'entier superieur 

# ou inferieur le plus proche. 

$n = ceil($n); # arrondi superieur 
$n = floor($n); # arrondi inferieur 

# Produit "20-04-2001" pour aujourd'hui. 
$ch_date = strftime("%d-%m-%Y"), localtime); 

# Produit "vendredi 04/20/01" pour la meme date. 
$ch_date = strftime(%A %D"), localtime); 

# Essaie de nouveaux noms de fichiers temporaires jusqu'a en trouver un qui 

# n'existe pas deja; voir egalement File::Temp sur CPAN ou dans la V5.6.1. 
do { 

$nom = tmpnam(); 
} until sysopen(HF, $nom, 0_CREAT|0_EXCL|0_RDWR, 0666); 

# Verifie si le systeme a un operateur chown peu sur le trahissant. 
if (sysconf(_PC_CHOWN_RESTRICTED)) { 

print "Hourra -- seul le super-utilisateur peut appeler chown\n"; 

} 

# Trouve les informations par uname du systeme courant. 

my ($noyau, $hote, $release, $version, $materiel) = uname(); 

use POSIX ":queue"; 

while (($pid_mort = waitpid(-l, &WN0HANC) ) > 0) { 

# Faites quelque chose avec $pid_mort si vous le voulez. 

} 

# Devient le leader d'une nouvelle session/nouveau groupe de processus 

# (necessaire pour creer des demons non-affectes par les signaux 

# du clavier ou les shells de connexion se terminant). 
setsid(o) or die "echec de setsid : $!"; 

Le module POSIX de Perl vous permets d'acceder a tous (ou presque tous) les identifica- 
teurs du standard POSIX 1003.1, plus quelques uns du C ANSI que nous ne savions pas 
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ou mettre. Ce module fournit plus de fonctions qu'aucun autre. Voir sa documentation 
en ligne pour une seance de dissection ou le POSIX Programmer's Guide de Donald Lewi- 
ne (O'Reilly, 1991). 

Les identificateurs qui sont des #defines sans parametres en C, comme EINTR ou 
0_NDELAY sont automatiquement exporter dans votre espace de noms en tant que fonc- 
tions constantes. Les fonctions qui ne sont normalement pas disponibles en Perl (com- 
me floor, ceil, strftime, uname, setsid, setlocale et sysconf ) sont exportes par 
defaut. Les fonctions du meme nom que les operateurs internes de Perl, comme open, 
ne sont pas exportees a moins de le demander explicitement, mais la plupart de gens 
sont susceptibles de preferer des noms de fonctions pleinement qualifies pour distin- 
guer POSIX: :open de CORE: :open. 

Quelques fonctions ne sont pas implementees car elles sont specifiques au C. Si vous 
tenter de les appelez, elles affichent un messages vous disant qu'elles ne sont pas imple- 
mentees et vous suggerent d'utiliser un equivalent Perl s'il en existe. Par exemple, une 
tentative d'acceder a la fonction setjmp affiche le message « setjmpQ is C-specific: 
use eval {} instead » et tmpfile vous dit « Use method 
10: :File: :new_tmp_file() ». (Mais depuis la version 5.6.1, vous devriez plutot utilisez 
File: :Temp.) 

Le module POSIX vous emmene aussi pres du systeme d'exploitation (ou tout du moins 
aux parties adressees par le standard POSIX) que ne le ferait n'importe quel program- 
meur C. Ceci vous donne acces a un pouvoir phenomenale et a des choses tres utiles, 
comme bloquer les signaux et controler les options des entrees/sorties du terminal. Tou- 
tefois, cela signifie egalement que votre code finira par ressembler quasiment a du C. 
Comme demonstration utile de la maniere d'eviter les vidages de tampons en entree, 
voici un exemple d'un programme complet pour obtenir un seul caractere en entree 
sans tampon, sur un systeme POSIX : 

#!/usr/bin/perl -w 
use strict; 

$1 = i; 

for (1..4) { 
my $lu; 

print "donnez-moi : "; 
$lu = lire_un(); 
print "--> $lu\n"; 

} 

exit; 

BEGIN { 

use POSIX qw( :termios_h); 

my ($term, $oterm, $echo, $noecho, $df_entree); 

$df_entree = fileno(STDIN); 

$term = POSIX: :Termios->new() ; 

$term->getattr($df_entree); 

$oterm = $term->getlflag(); 

$echo = ECHO | ECHOK | ICANON; 

$noecho = $oterm & ~$echo; 

sub cbreak { 
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$term->setlf lag($noecho) ; 
$term->setcc(VTIME, l); 
$term->setattr($df_entree, TCSANOW); 

} 

sub cuisine { 

$term->setflag($oterm); 
$term->setcc(VTIME, 0); 
$term->setattr($df_entree, TCSANOW); 

} 

sub lireun { 

my $clef = ""; 
cbreakQ; 

sysread(STDIN, $clef, l); 

cuisine(); 

return $clef; 

} 

} 

END { cuisineQ } 

La page de man du module POSIX donne un inventaire complet des fonctions et cons- 
tantes qu'il exporte. II y en a tant que vous finirez souvent par n'en importer qu'un sous- 
ensemble, comme « : queue », « : sys_stat_h » ou « : termios_h ». Un exemple de blo- 
cage de signaux avec le module POSIX est donne au chapitre 16. 

Safe 

use Safe; 

$mem_proteg = Safe->new(); # espace memoire protege anonyme 

$mem_proteg = Safe->new("Nom_Paquetage"); # dans cette table de symboles 

# Active ou desactive les codes d'operation par groupe ou par nom 
$mem_proteg- >permit (qw( : basecore) ) ; 

$mem_proteg->permit_only(qw(:base_core :base_loop :base_mem)); 
$mem_proteg->deny("die"); 

# comme do() mais dans l'espace memoire protege 
$ok = $mem_proteg->rdo($fichier); 

# comme eval() mais dans l'espace memoire protege 

$ok = $mem_proteg->reval($code); # sans 'use strict' 

$ok = $mem_proteg->reval($code, l); # avec 'use strict' 

Le module Safe tente de fournir un environnement restreint pour proteger le reste du 
programme des operations dangereuses. II utilise deux strategies differentes pour ac- 
complir ceci. Un peu comme l'utilisation de chroot(2) par les demons FTP anonymes al- 
tere la vue que Ton a de la racine du systeme de fichier, la creation d'un objet 
compartiment avec Safe->new("Nom_Paquetage") altere la vue que ce compartiment a 
de son propre espace de noms. Le compartiment voit maintenant comme sa table de 
symboles racine (main : : ), la table de symboles que le reste du programme voit comme 
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Nom_Paquetage: :. Ce qui ressemble a Bidule: : a l'interieur du compartiment est en 
realite Nom_Paquetage: : Bidule: : a l'exterieur. Si vous ne donnez pas d'argument au 
constructeur, un nouveau nom de paquetage aleatoire est selectionne pour vous. Le se- 
cond et le plus important service fournit par un compartiment Safe est une maniere de 
limiter le code considere comme legal a l'interieur d'un eval. Vous pouvez ajuster l'en- 
semble des codes d'operations (opcodes) autorises en utilisant des appels de methodes 
sur votre objet Safe. Deux methodes sont disponibles pour compiler du code dans un 
compartiment Safe : rdo (« restriction du do ») pour les fichiers et reval (« restriction 
de Feval ») pour les chaines. lis fonctionnent comme do sur un nom de fichier et com- 
me eval sur une chaine mais ils s'executent dans un espace de noms restreint avec des 
codes d'operations limites. Le premier argument est le nom du fichier ou la chaine a 
compiler et le second, qui est optionnel, indique si le code doit etre compile sous use 
strict ou pas. 

II est prevu de reecrire ce module (nous avons l'intention d'isoler l'espace memoire pro- 
tege dans une tache (thread) d'interpreteur differente pour une securite supplementai- 
re), assurez-vous done de verifier la page de man de Safe pour les mises a niveau. Voir 
egalement le chapitre 23. 

Socket 

use Socket; 

$proto = getprotobyname(''udp''); 

socket (SOCK , PF_INET, SOCKDGRAM, $proto) 

or die "socket : $!"; 
$iadr = gethostbyname(''hishost.com''); 
$port = getservbyname(''time'' , 'udp'); 
$sin = sockaddr_in($port, $iadr); 
send(S0CK, 0, 0, $sin) 

or die "send : $!"; 

$proto = getprotobynameCtcp'); 

socket (SOCK, PF_INET J SOCK_STREAM, $proto) 

or die "socket : $!"; 
$port = getservbyname(''smtp'' , ■'tcp''); 
$sin = sockaddr_in($port, inet_aton("127.1")); 
$sin = sockaddr_in(7, inet_aton("localhost"))j 
$sin = sockaddr_in(7, INADDR_LOOPBACK) ; 
connect(S0«, $sin) 

or die "connect : $!"; 

($port, $iadr) = sockaddr_in(getpeerbyname(SOC/C )); 
$hote_pair = gethostbyaddr($iadr, AF_INET); 
$adr_pair = inet_ntoa($iadr); 

$proto = getprotobynameCtcp'); 
socket(S0«, PFJJNIX, SOCK_STREAM, $proto) 
or die "socket : $!"; 
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unlinkC/tmp/usock''); # XXX : l'echec est ignore intentionnellement 
$sun = sockaddr_un('tmp/usock'); 
connect(S0«, $sun) 

or die "connect : $!"; 

use Socket qw( : DEFAULT :crlf); 

# Maintenant vous pouvez utiliser CR(), LF() et CRLF() ou 

# $CR, $LF et $CRLF pour les fins de lignes. 

Le module Socket donne acces aux constantes du fichier #include sys/socket.h de la bi- 
bliotheque C pour qu'on les utilise dans les fonctions de bas niveau de Perl concernant 
les sockets. II fournit egalement deux fonctions, inet_aton et inet_ntoa, pour convertir 
les adresses IP entres leurs representations ASCII (comme « 127.0.0.1 ») et leur empa- 
quetage reseau, ainsi que deux fonctions speciales d'empaquetage/depaquetage, 
sockaddr_in et sockaddr_un, qui manipulent les adresses de sockets binaires necessaires 
aux appels bas niveau. Le tag d'importation : crlf donne des noms symboliques aux 
conventions diverses de fin de ligne afin que vous n'ayez pas a vous fier aux interpreta- 
tions natives de \r et \n, qui peuvent varier. La plupart des protocoles de l'lnternet pre- 
ferent CRLF mais tolerent LF. Le module standard 10: : Socket fournit une interface de 
plus haut niveau a TCE Voir le chapitre 16. 



Symbol 

use Symbol "delete_package"; 
delete_package("Truc : : Bidule" ) ; 

print "supprimeAn" unless exists $Truc: :{"Bidule: :"}; 



use Symbol "gensym"; 
$syml = gensymQ; 
$sym2 = gensym(); 

package Demo; 

use Symbol "qualify"; 

$sym = qualify("x"); 

$sym = qualify("x", "True"); 

$sym = qualify("Bidule: :x"); 

$sym = qualify("Bidule: :x", 



# Renvoie un nouveau typeglob anonyme. 

# Et encore un autre. 



# "Demo::x" 

# "Truc::x" 

# "Bidule: :x" 
"True"); # "Bidule: :x" 



use Symbol "qualifytoref "; 
sub pass_handle(*) { 

my $hf = qualify_to_ref (shift, caller); 



} 



# Maintenant vous pouvez appeler pass_handle avec HF, "HF", *HF ou \*HF. 

Le module Symbol fournit des fonctions pour faciliter la manipulation des noms glo- 
baux : les typeglobs, les noms de formats, les handles de fichiers, les tables de symboles 
de paquetages et tout autre chose que vous pourriez vouloir nommer via une table de 
symboles. La fonction delete_package nettoie completement l'espace de nom d'un pa- 
quetage (en rendant effectivement anonymes toutes references supplementaires aux re- 
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ferants de la tables de symboles, y compris les references de code precompile). La 
fonction gensym renvoie un typeglob anonyme chaque fois qu'elle est appelee. (Cette 
fonction n'est plus tellement utilisee de nos jours, maintenant que les scalaires indefinis 
s'autovivifient avec les handles de fichiers appropries lorsqu'ils sont utilises comme ar- 
guments de open, pipe, socket et leurs semblables.) 

La fonction qualify prend un nom qui peut etre completement qualifie avec un paque- 
tage, ou pas, et renvoie un nom qui l'est. Si elle a besoin de prefixer le nom du paque- 
tage, elle utilisera le nom specifie via le second argument (ou s'il est omis, votre nom de 
paquetage courant). La fonction qualif y_to_ref fonctionne de la mime maniere mais 
produit une reference au typeglob que le symbole representerait. Ceci est important 
dans les fonctions qui requierent qu'ils soient passes en tant que references. En conver- 
tissant cet argument avec qualify_to_ref, vous pouvez maintenant utiliser le handle 
fourni mime avec strict ref s active. Vous pouvez egalement le consacrer avec bless 
dans une forme objet, puisqu'il s'agit d'une reference valide. 

Sys::Hostname 

use Sys: :Hostname; 
$hote = hostname(); 

Le module Sys : : Hostname ne fournit qu'une seule fonction, hostname, qui compense ce 
fait en se remuant le derriere pour essayer de deviner comment votre hote courant s'ap- 
pelle. Sur les systemes qui supportent l'appel systeme standard gethostname(2), celui-ci 
est utilise, comme il s'agit de la methode la plus efficace. 6 Sur les autres systemes, l'affi- 
chage de l'appel standard hostname{\) est employe. Sur d'autres encore, on appelle la 
fonction uname(3) de votre bibliotheque C, laquelle est egalement accessible par la fonc- 
tion POSIX: :uname de Perl. Si ces strategies echouent toutes, d'autres efforts heroi'ques 
sont tentes. Quelles que soient les opinions de votre systeme sur ce qui est sense ou in- 
sense, Perl essaie de son mieux pour faire avec. Sur certains systemes, ce nom d'hote 
peut ne pas etre pleinement qualifie avec le nom de domaine ; voir le module Net : : Do- 
main de CPAN si vous avez besoin de cela. 

II faut egalement prendre en consideration que hostname ne renvoie qu'une seule va- 
leur mais que votre systeme peut avoir plusieurs interfaces reseaux configurees, vous 
pouvez done ne pas vous voir renvoyer le nom associe a l'interface a laquelle vous vous 
interessez si vous prevoyez d'utiliser ce module pour certains types de programmation 
de sockets. II s'agit des cas ou vous devrez probablement glaner dans l'affichage de la 
commande ifconfig(8) ou dans l'equivalent moral sur votre systeme. 

Sys::Syslog 

use Sys::Syslog; # Perd setlogsock. 

use Sys::Syslog qw(:DEFAULT setlogsock); # Obtient egalement setlogsock. 



6. Laquelle est accessible directement par la fonction non-exportee Sys: : Hostname: :ghname, 
mais ne dites a personne qu'on vous l'a dit. 
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openlog($programme, 'cons,pid' , 'user'); 
syslog( 'info', 'ceci est un autre test'); 

syslog('mail|warning', 'ceci est un meilleur test : Xd' , time()); 
closelog(); 

syslog('debug' , 'ceci est le dernier test'); 
setlogsock('unix'); 

openlog("$programme $$", 'ndelay', 'user'); 

syslog('info', 'le probleme etait %m'); # %m = $! pour le journal systeme 
syslogC notice' , 'prog_truc : ceci est vraiment termine'); 

setlogsock('unix'); # "inet" ou "unix" 

openlog("mon_programme" , $logopt, $services); 
syslog($priorite, $format, @args); 
$ancien_masque = setlogmask($priorite_masque); 
closelog(); 

Le module Sy s : : Sy slog se comporte comme la fonction syslog(3) de votre bibliotheque 
C, en envoyant des messages au demon de votre journal systeme, syslogd(8). II est parti- 
culierement utile dans les demons ou d'autres programmes qui ne disposent pas de ter- 
minal pour recevoir les affichages de diagnostics ou pour des programmes preoccupes 
par la securite qui veulent produire un enregistrement plus durable de leurs actions (ou 
des actions de quelqu'un d'autre). Les fonctions supportees sont : 

openlog IDENT, LISTE_OPT, SERVICES 

Etablit une connexion avec votre amical demon syslog. IDENT est la chaine sous 
laquelle enregistrer le message (comme $0, le nom de votre programme). 
LISTE_0PT est une chaine avec des options separees par des virgules comme 
« cons », « pid » et « ndelay ». SERVICES est quelque chose comme « auth », 
« daemon », « kern », « lpr », « mail », « news » ou « user » pour les programmes 
systeme et parmi « localo » . . « local7 » pour les programmes locaux. Davantage 
de messages sont enregistres en utilisant un service donnee et la chaine identifica- 
trice. 

syslog PRIORITE, FORMAT, ARGS 

Envoie un message au demon en employant la PRIORITE donnee. Le FORMAT est 
exactement comme printf en comblant les sequences d'echappement des pourcen- 
tages avec les ARCS qui suivent excepte le fait qu'en respectant les conventions de la 
fonction syslog(3) de la bibliotheque standard, la sequence speciale « %m » est inter- 
polee avec errno (la variable $ ! de Perl) a cet endroit. 

setlogsock TYPE 

TYPE doit valoir soit « inet », soit « unix ». Certains demons de systemes ne font 
pas attention par defaut aux messages de syslog provenant du domaine Internet, 
vous pouvez alors lui affecter « unix » a la place, puisqu'il ne s'agit pas de la valeur 
par defaut. 

closelog 

Rompt la connexion avec le demon. 
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Pour que ce module fonctionne avec les versions de Perl anterieures a la 5.6.0, votre ad- 
ministrateur systeme doit lancer h2ph(l) sur votre fichier d'en-tete sys/syslog.h pour 
creer un fichier de bibliotheque sys/syslog.ph. Toutefois, ceci n'etait pas accompli par de- 
faut a l'installation de Perl. Les versions ulterieures utilisent maintenant une interface 
XS, la preparation de sys/syslog.ph n'est done plus necessaire. 

Term::Cap 

use Term: :Cap; 

$ospeed = eval { 
require POSIX; 

my $termios = POSIX: :Termios->new(); 
$termios->getattr; 
$termios->getospeed; 
} II 9600; 

$terminal = Term: :Cap->Tgetent({ TERM => undef, OSPEED => $ospeed }); 
$terminal->Tputs('cl J , 1, STDOUT); # Efface l'ecran. 

$terminal->Tgoto( J cm J , $col, $lig, STDOUT); # Deplace le curseur. 

Le module Term: :Cap donne acces aux routines termcap(3) de votre systeme. Voir la do- 
cumentation de votre systeme pour plus de details. Le systemes qui ne disposent que de 
terminfo(5) mais pas de termcap(5) echoueront. (Beaucoup de systeme terminfo peuvent 
emuler termcap.) Toutefois, vous trouverez sur CPAN un module Term : : Inf o ainsi que 
Term: :ReadKey, Term: :ANSIColor et divers modules Curses pour vous aider avec les en- 
trees caractere par caractere, les affichages en couleur ou la gestions des ecrans de termi- 
naux a un niveau plus eleve que Term: :Cap ou Term: : Info. 

Text:: Wrap 

use Text::Wrap; # Importe wrap(). 

(Slignes = (< <"FIN_G&S" =~ A\S.*\S/g); 

Ceci est particulierement rapide, 

un boniment inintelligible 

n'est generalement 

pas entendu, 

et s'il 

l'est, on 

s'en fiche. 

FING&S 

$Text: :Wrap: : columns = 50; 

print wrap(" " x 8, " " x 3, @lignes), "\n"; 

Ceci affiche : 
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Ceci est particulierement rapide, un boniment inintelligible n'est 
generalement pas entendu, et s'il l'est, on s'en fiche. 

Le module Text: :Wrap implemente un formateur de paragraphes simples. Sa fonction 
wrap formate un simple paragraphe a la fois en coupant les lignes sans le faire au milieu 
d'un mot. Le premier argument est le prefixe ajoute au debut de la premiere ligne ren- 
voyee. Le second est la chaine utilisee comme prefixe pour toutes les lignes sauf la pre- 
miere. Tous les arguments suivants sont joints en utilisant un saut de ligne comme 
separateur et ils sont renvoyes comme une seule chaine de paragraphe reformatee. Vous 
devez apprecier vous-meme la largeur de votre terminal ou au moins specifier ce que 
vous desirez dans $Text: :Wrap: : columns. Bien que Ton puisse utiliser l'appel ioctl 
TIOCWINSZ pour apprecier le nombre de colonnes, il serait plus facile pour ceux qui ne 
sont pas habitues a la programmation en C, d'installer le module Term: :Readkey de 
CPAN et d'utiliser la routine GetTerminalSize de ce module. 

Timer.Local 

use Time: : Local; 

$date = timelocal($sec,$min,$heures,$jour_m,$mois,$annee); 
$date = timegm($sec,$min,$heures,$jour_m,$mois,$annee); 

$date = timelocal(50, 45, 3, 18, 0, 73); 

print "scalar localtime donne : ", scalar(localtime($date)), "\n"; 
$date += 28 * 365.2425 * 24 * 60 * 60; 

print "Vingt-huit annees plus tard, il est maintenant\n\t", 
scalar(localtime($date)), "\n"; 

Ceci affiche : 

scalar localtime donne : Thu Dan 18 03:45:50 1973 
Vingt-huit annees plus tard, il est maintenant 
Wed Dan 17 22:43:26 2001 

Le module Time: : Local fournit deux fonctions, timelocal et timegm, qui fonctionne 
exactement a l'inverse des fonctions localtime et gmtime, respectivement. C'est-a-dire 
qu'elles prennent une liste de valeurs numeriques pour les divers composants de ce que 
localtime renvoie dans un contexte de liste et determinent quel parametre passe en en- 
tree a localtime aurait produit ces valeurs. Vous pouvez utiliser ceci si vous voulez com- 
parer ou lancer des calculs sur deux dates differentes. Bien que ces fonctions ne soient 
pas generiques pour analyser les dates et les heures, si vous pouvez vous arranger pour 
avoir vos parametres dans le bon format, elles sont souvent suffisantes. Comme vous 
pouvez le voir dans l'exemple ci-dessus, la date et l'heure possedent tout de meme quel- 
que excentricites et meme de simples calculs echouent souvent pour faire ce qu'on leur 
demande a cause des annees bissextiles, des secondes intercallaires et de la phase de la 
lune. Deux modules de CPAN, enormes mais complets, s'occupent de ces problemes et 
bien plus encore : Date: :Calc et Date: :Manip. 
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Timer.localtime 

use Time: : localtime; 

print "L'annee est %d\n", localtime->year() +1900; 

$maintenant = ctime(); 

use Time: :localtime; 
use File: :stat; 

$date_chaine = ctime(stat($fichier)->mtime); 

Ce module supplante la fonction intrinseque localtime en la remplacant avec une ver- 
sion qui renvoie un objet Time : : tm (ou undef en cas d'echec). Le module Time : : gmtime 
fait de meme, mais il remplace la fonction intrinseque gmtime a la place. L'objet renvoye 
possede des methodes qui accedent aux champs nommes comme ceux de la structure 
struct tm dans time.h de la bibliotheque C : sec, min, hour, mday, mon, year, wday, yday 
et isdst. La fonction ctime donne un moyen d'obtenir la fonction originate (dans son 
sens scalaire) CORE: : localtime. Remarquez que les valeurs renvoyees proviennent di- 
rectement d'une structure struct tm, elles se situent done dans les mimes intervalles, 
voir l'exemple ci-dessus pour la maniere correcte de produire une annee sur quatre chif- 
fres. La fonction POSIX: :strftime est encore plus utile pour formater les dates et les 
heures avec une grande variete de styles plus allechants les uns que les autres. 

User::grent 

use User: :grent; 

$gr = getgrgid(o) or die "Pas de groupe zero"; 

if ($gr->name eq "audio" && @{$gr->members} > l) { 

print "le gid zero s'appelle audio et compte d'autres membres"; 

} 

$gr = getgr($n_importe_qui); # Accepte a la fois une chaine ou un nombre. 
use User::grent ': FIELDS'; 

$gr = getgrgid(o) or die "Pas de groupe zero"; 

if ($gr_name eq "audio" && @gr_members > l) { 

print "le gid zero s'appelle audio et compte d'autres membres"; 

} 

Les exportations par defaut de ce module supplantent les fonctions intrinseques 
getgrent, getgruid et getgrnam, en les remplacant par des versions qui renvoient un 
objet User: :grent (ou undef en cas d'echec). Cet objet possede des methodes qui acce- 
dent aux champs nommes comme ceux de la structure struct group dans grp.h de la 
bibliotheque C : name, passwd, gid et members (et pas mem comme en C !). Les trois pre- 
mieres renvoient des scalaires et la derniere une reference de tableau. Vous pouvez ega- 
lement importer les champs de la structure dans votre propre espace de noms en tant 
que variables ordinaires en utilisant le tag d'importation « : FIE LDS », bien que ceci sup- 
plante toujours les fonctions intrinseques. Les variables (les trois scalaires et le tableau) 
sont prefixees par « gr_ ». La fonction getgr est une simple bascule frontale qui fait sui- 
vre tout argument numerique a getgrid et tout argument chaine a getgrnam. 
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Userr.pwent 

# Par defaut, supplante seulement les fonctions intrinseques. 
use User: :pwent; 

$pw = getpwnam("daemon") or die "Pas d'utilisateur daemon"; 
if ($pw->uid == 1 && $pw->dir =~ m# A /(bin|tmp)?$# ) { 
print "uid 1 sur le repertoire racine"; 

} 

$pw = getpw($n_importe_qui); # Accepte a la fois une chaine ou un nombre. 
$shell_reel = $pw->shell || Vbin/sh'; 
for (($nom_complet, $bureau, $tel_bur, $tel_maison) = 
split /\s*,\s*/ , $pw->gecos) 

{ 

s/&/ucfirst(lc($pw->name))/ge; 

} 

# positionne des variables globales dans le paquetage courant. 
use User::pwent qw(:FIELDS); 

$pw = getpwnam("daemon") or die "Pas d'utilisateur daemon"; 
if ($pw_uid == 1 && $pw_dir =~ m# A /(bin|tmp)?$# ) { 
print "uid 1 sur le repertoire racine"; 

} 

use User::pwent qw/pw_has/; 

if (pw_has(qw[gecos expire quota])) { ... } 

if (pw_has("name uid gid passwd")) { ... } 

printf "Votre struct pwd supporte [%s]\n", scalar pw_has(); 

Les exportations par defaut de ce module supplantent les fonctions intrinseques 
getpwent, getpwuid et getpwnam, en les remplacant par des versions qui renvoient un 
objet User: : pwent (ou undef en cas d'echec). II est souvent preferable d'utiliser ce mo- 
dule plutot que les fonctions intrinseques qu'il remplace, car les fonctions intrinseques 
surchargent, voire omettent divers elements dans la liste renvoyer au nom de la compa- 
tibility ascendante. 

L'objet renvoye possede des methodes qui accedent aux champs nommes comme ceux 
de la structure passwd dans pwd.h de la bibliotheque C, avec le prefixe « pw_ » en 
moins : name, passwd, uid, gid, change, age, quota, comment, class, gecos, dir, shell et 
expire. Les champs passwd, gecos et shell sont marques. Vous pouvez egalement im- 
porter les champs de la structure dans votre propre espace de noms en tant que variables 
ordinaires en utilisant le tag d'importation « : FIELDS », bien que ceci supplante tou- 
jours les fonctions intrinseques. Vous accedez a ces champs en tant que variables scalai- 
res nomme avec un prefixe « pw_ » devant le nom de la methode. La fonction getpw est 
une simple bascule frontale qui fait suivre tout argument numerique a getpwuid et tout 
argument chaine a getpwnam. 

Perl croit qu'aucune machine n'a plus d'un champ parmi change, age ou quota d'imple- 
mente, ni plus d'un parmi comment ou class. Certaines machines ne supportent pas ex- 
pire, gecos, on dit que certaines machines ne supportent meme pas passwd. Vous 
pouvez appeler ces methodes quelle que soit la machine sur laquelle vous etes mais elles 
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retourneront undef si dies ne sont pas implementees. Voir passwd(5) et getpwent(3) 
pour plus de ddails. 

Vous pouvez determiner si ces champs sont implemented en le demandant a la fonction 
non-portable pw_has. Elle renvoie vrai si tous les parametres sont des champs supported 
sur la plate-forme ou faux si au moins un ne Test pas. Elle leve une exception si vous 
demandez un champ dont le nom n'est pas reconnu. Si vous ne passez aucun argument, 
elle renvoie la liste des champs que votre bibliotheque C pense qu'ils sont supported. 

L'interprdation du champ gecos varie entre les systemes mais il comprend souvent qua- 
tre champs separes par des virgules contenant le nom complet de l'utilisateur, l'empla- 
cement de son bureau, son telephone professionnel et son telephone personnel. Un & 
dans le champ gecos doit etre remplace par le nom de login, name, de l'utilisateur avec 
les majuscules et minuscules correctes. Si le champ shell est vide, on suppose qu'il vaut 
/bin/sh, bien que Perl ne le fasse pas pour vous. Le passwd est donnee par une fonction 
de hachage a sens unique produisant du charabia au lieu d'un texte lisible, et on ne peut 
inverser la fonction de hachage en essayant brutalement toutes les combinaisons possi- 
bles. Les systemes securises utilisent souvent une fonction de hachage plus sure que 
DES. Sur les systemes supportant les mots de passes caches, Perl renvoie automatique- 
ment l'entree du mot de passe sous sa forme cachee lorsqu'un utilisateur suffisamment 
puissant l'appelle, meme si la bibliotheque C sous-jacente fournie par votre construc- 
teur avait une vision trop courte pour realiser qu'il aurait du faire cela. 
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Messages de diagnostic 



Ces messages sont classes dans un ordre croissant de desespoir : 



Classe 


Signification 


(W) 


Un avertissement (optionnel). 


(D) 


Une obsolescence (optionnelle). 


(S) 


Un avertissement serieux (obligatoire). 


(F) 


Une erreur fatale (interceptable). 


(P) 


Une erreur interne (panique) que vous ne devriez jamais rencontrer (intercep- 




table). 


(X) 


Une erreur extremement fatale (non-interceptable). 


(A) 


Une erreur venue de Pau-dela (non generee par Perl). 



La plupart des messages des trois premieres classifications ci-dessus ( W, D et S) peuvent 
etre controles en utilisant le pragma warnings ou les options -w et -W. Si un message 
peut etre controle avec le pragma warnings, la categorie correspondante de cet avertis- 
sement est donnee apres la lettre de classification ; par exemple, (W misc) indique un 
avertissement de type divers. Le pragma warnings est decrit au chapitre 31, Modules de 
pragmas. 

Les avertissements peuvent etre captures plutot qu'affiches en faisant pointer 

$SIG{ WARN } sur une reference de routine qui sera appelee pour chaque message. 

Vous pouvez egalement en prendre le controle avant qu'une erreur interceptable 

« meure » en assignant une reference de sous-programme a $SIG{ DIE }, mais si 

vous n'appelez pas die a l'interieur de ce gestionnaire, l'exception sera toujours presente 
en revenant. En d'autres termes, il n'est pas possible de la « defataliser » par ce biais. 
Vous devez utiliser eval a cet effet. 

Les avertissements par defaut sont toujours actives sauf s'ils sont explicitement desacti- 
ves avec le pragma warnings ou l'option -X. 
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Dans les messages suivants, ^srepresente une chame interpolee qui n'est determined 
qu'au moment de la generation du message. (De meme, %d represente un nombre 
interpole — pensez aux formats de printf, mais %d signifie ici un nombre dans n'im- 
porte quelle base.) Remarquez que certains messages commencent par %s — d'oii une cer- 
taine difficulte a les classer dans l'ordre alphabetique. Vous pouvez chercher dans ces 
messages si celui que vous recherchez n'apparait pas a l'endroit attendu. Les symboles 
"%-?@ sont tries avant les caracteres alphabetiques, alors que [ et \ le sont apres. 

Si vous etes persuade qu'un bogue provient de Perl et non de vous, essayez de le reduire 
a un cas de test minimal et faites un rapport avec le programme perlbug qui est fourni 
avec Perl. 

N.d.T. Les messages sont indiques ici en anglais tels qu'ils apparaissent a l'execution de 
vos scripts Perl. Toutefois, nous en donnons ici une traduction pour en faciliter la com- 
prehension. 

"%s" variable %s masks earlier declaration in same %s 

(La variable "%s " masque une declaration precedente dans la meme %s) 
(W misc) Une variable my ou our a ete redeclaree dans la portee ou dans l'instruc- 
tion courante, eliminant effectivement tout acces a l'instance precedente. II s'agit 
presque toujours d'une erreur de typographic Remarquez que la variable declaree 
plus tot existera toujours jusqu'a la fin de la portee ou jusqu'a ce que toutes les fer- 
metures qui s'y referent soient detruites. 

"my sub" not yet implemented 

("my sub" n'est pas encore implemente) 

(F) Les sous-programmes de portee lexicale ne sont pas encore implementes. 
N'essayez pas encore cela. 

"my" variable %s can't be in a package 

(La variable "my" %s ne peut pas se trouver dans un paquetage) 
(F) Les variables de portee lexicale ne se trouvent pas dans un paquetage, et il ne 
sert done a rien d'essayer d'en declarer une, prefixee d'un qualificateur de paque- 
tage. Utilisez local si vous desirez donner une valeur locale a une variable de 
paquetage. 

"no" not allowed in expression 

("no" n'est pas autorise dans une expression) 

(F) Le mot-clef no est reconnu et execute a la compilation et il ne renvoie aucune 
valeur utile. 

"our" variable %s redeclared 

(La variable "our" %s est redeclaree) 

(W misc) II semble que vous avez deja declare la meme variable globale auparavant 
dans la meme portee lexicale. 

"use" not allowed in expression 

("use" n'est pas autorise dans une expression) 

(F) Le mot-clef use est reconnu et execute a la compilation et il ne renvoie aucune 
valeur utile. 
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' ! ' allowed_only_after types %s 

(' ! ' n'est autorise qu'apres les types %s) 

(F) Le ' ! ' n'est autorise dans pack et unpack qu'apres certains types. 
'|' and '<' may not both be specified on command line 

(' | ' et ' < ' ne peuvent pas etre specifies en meme temps sur la ligne de commande) 
(F) II s'agit d'une erreur specifique a VMS. Perl effectue ses propres redirections 
dans la ligne de commande. II se trouve que STDIN etait un pipe et que vous avez 
essaye de rediriger STDIN en utilisant <. Un seul flux STDIN par personne, s'il vous 
plait. 

'|' and '>' may not both be specified on command line 

(' | ' et ' > ' ne peuvent pas etre specifies en meme temps sur la ligne de commande) 
(F) II s'agit d'une erreur specifique a VMS. Perl effectue ses propres redirections 
dans la ligne de commande et pense que vous avez essaye de rediriger STDOUT a la 
fois dans un fichier et dans un pipe vers une autre commande. Vous devez choisir 
Fun ou l'autre, bien que rien ne vous empeche de rediriger dans un pipe vers un 
programme ou un script Perl qui separe la sortie standard en deux flux, comme 
dans : 

open(S0RTIE,">$ARGV[0]") or die "Impossible d'ecrire dans $ARGV[o] : $!"; 
while (<STDIN>) { 
print; 

print SORTIE; 

} 

close SORTIE; 
/ cannot take a count 

(/ ne peut pas etre lie a un compteur) 

(F) Vous aviez un canevas pour unpack indiquant une chaine d'une longueur 
sujette a un compteur mais vous avez egalement specifie une taille explicite pour 
cette chaine. 

/ must be followed by a, A ou Z 

(/ doit etre suivi par A, a ou Z) 

(F) Vous aviez un canevas pour unpack indiquant une chaine d'une longueur 
sujette a un compteur ; cette chaine doit etre suivie d'une des lettres a, A ou Z pour 
indiquer quelle sorte de chaine doit etre depaquetee. 

/ must be followed by a*, A* ou Z* 

(/ doit etre suivi par A*, a* ou Z*) 

(F) Vous aviez un canevas pour unpack indiquant une chaine d'une longueur 
sujette a un compteur. Actuellement, les seules choses dont on peut compter la lon- 
gueur sont a*, A* ou Z*. 

/ must follow a numeric type 

(/ doit suivre un type numerique) 

(F) Vous aviez un canevas pour unpack contenant un #, mais celui-ci ne suivait pas 
l'une des specifications numeriques d'unpack. 
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% may only be used in unpack 

(% ne peut etre utilise que dans unpack) 

(F) Vous ne pouvez pas empaqueter une chame avec pack en fournissant une 
somme de controle car le traitement de cette derniere fait perdre de l'information 
et vous ne pouvez pas revenir en arriere. 

Repeat count in pack overflows 

(Depassement du compteur de repetitions dans pack) 

(F) Vous ne pouvez pas specifier un compteur de repetitions tellement grand qu'il 
depasse la limite pour vos entiers signes. 

Repeat count in unpack overflows 

(Depassement du compteur de repetitions dans unpack) 

(F) Vous ne pouvez pas specifier un compteur de repetitions tellement grand qu'il 
depasse la limite pour vos entiers signes. 

/%s/ Unrecognized escape \\%c passed through 

(/%s/ : Rencontre d'une sequence d'echappement \\%c inconnue) 

(W regexp) Vous avez employe une combinaison avec un caractere antislash qui 

n'est pas reconnue par Perl. Cette combinaison apparait dans une variable interpo- 

lee ou une expression reguliere delimitee par ' . Le caractere a ete interprets littera- 

lement. 

I%sl Unrecognized escape \\%c in character class passed through 

(/%s/ : Rencontre d'une sequence d'echappement \\%c inconnue dans une classe 
de caracteres) 

(W regexp) Vous avez employe une combinaison avec un caractere antislash qui 
n'est pas reconnue par Perl a l'interieur d'une classe de caracteres. Le caractere a ete 
interprete litteralement. 

I%sl should probably be written as "%s" 

(/%s/ devrait probablement etre ecrit "%s") 

(W syntax) Vous avez employe un motif la ou Perl s'attendait a trouver une chaine, 
comme dans le premier argument de join. Perl utilisera comme chaine le resultat 
vrai ou faux de la correspondance entre le motif et $_, ce qui n'est probablement 
pas ce que vous aviez en tete. 

%s{...) interpreted as function 

(%s ( . . . ) interprete comme une fonction) 

(W syntax) Vous avez deroge a la regie qui dit que tout operateur de liste suivi par 
des parentheses devient une fonction prenant comme arguments tous les opera- 
teurs de listes trouve entre les parentheses. 

%s() called too early to check protoype 

(%s ( ) appelee trop tot pour verifier le prototype) 

(W prototype) Vous avez appele une fonction possedant un prototype avant que 
l'analyseur syntaxique ne voie sa declaration ou sa definition et Perl ne peut pas 
verifier si l'appel se conforme au prototype. Pour obtenir une verification correcte 
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du prototype, vous devez soit ajouter une declaration du prototype pour le sous- 
programme en question plus haut dans le code, soit deplacer la definition du sous- 
programme avant l'appel. Ou alors, si vous etes certains d'appeler la fonction cor- 
rectement, vous pouvez mettre une esperluette devant le nom pour eviter l'avertis- 
sement. 

%s argument is not a HASH or ARRAY element 

(L'argument %s n'est un element ni de HACHAGE, ni de TABLEAU) 

(F) L'argument de exists doit etre un element de hachage ou de tableau, comme : 

$truc{$bidule} 

$ref->{"susie"}[l2] 

%s argument is not a HASH or ARRAY element or slice 

(L'argument %s n'est un element ni de HACHAGE, ni de TABLEAU, ni une tran- 
che) 

(F) L'argument de delete doit etre soit un element de hachage ou de tableau, 
comme : 

$truc{$bidule} $ref->{"susie"}[l2] 
soit une tranche de hachage ou de tableau, comme : 
(Struc^bidule, $machin, $chouette] 
@{$ref->[l2]}{"susie" J "queue"} 

%s argument is not a subroutine name 

(L'argument %s n'est pas un nom de sous-programme) 

(F) L'argument de exists pour exists &sub doit etre un nom de sous-programme 
et non un appel de sous-programme, exists &sub() generera cette erreur. 

%s did not return a true value 

(%s n'a pas renvoye une valeur vraie) 

(F) Un fichier requis par require (ou utilise par use) doit retourner une valeur 
vraie pour indiquer qu'il s'est compile correctement et que l'initialisation de son 
code s'est bien passee. II est habituel de placer un 1; a la fin d'un tel fichier, bien 
qu'une quelconque valeur fasse l'affaire. 

%s failed--call queue aborted 

(%s a echoue — file d'appels abandonnee) 

(F) Une exception non capturee a ete levee pendant l'execution d'un sous-pro- 
gramme CHECK, INIT ou END. Le traitement du reste de la file contenant de telles 
routines s'est termine prematurement. 

%s found where operator expected 

(%s trouve la ou Ton attendait un operateur) 

(S) L'analyseur lexicographique de Perl sait s'il attend un terme ou un operateur. 
S'il voit ce qu'il sait etre un terme alors qu'il s'attend a un operateur, il vous donne 
ce message d'alerte. Habituellement, cela indique qu'un operateur ou un separa- 
teur a ete omis, comme un point virgule. 
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%s had compilation errors 

(%s a engendre des erreurs de compilation) 

(F) C'est le message final lorsqu'un perl -c echoue. 
%s has too many errors 

(%s a engendre trop d'erreurs) 

(F) L'analyseur abandonne son analyse du programme apres 10 erreurs. Les messa- 
ges suivant ne seraient pas senses. 

%s matches null string many times 

(%s correspond trop de fois a la chaine vide) 

(W regexp) Le motif que vous avez specifie rentrerait dans une boucle infinie si le 
moteur d'expressions regulieres ne controlait pas cela. 

%s never introduced 

(%s n'a jamais ete introduit) 

(S internal) Le symbole en question a ete declare mais sa portee s'est terminee 
avant qu'il soit possible de s'en servir. 

%s package attribute may clash with future reserved word: %s 

(L'attribut de paquetage %s risque de rentrer en conf lit avec le mot %s reserve pour 
une utilisation ulterieure) 

(W reserved) Un nom d'attribut en minuscules gere par un paquetage specifique a 
ete utilise. Ce mot pourrait avoir un sens pour Perl un jour, meme si ce n'est pas 
encore le cas. Peut-etre devriez-vous employer a la place un nom avec des majuscu- 
les et des minuscules melangees. 

%s syntax OK 

(%s syntaxe OK) 

(F) Message final lorsqu'un perl -c a reussi. 
%s: Command not found 

(%s: Commande introuvable) 

(A) Vous avez lance accidentellement votre script avec csh au lieu de Perl. Verifiez 
la ligne avec # ! ou lancez vous-meme votre script manuellement dans Perl avec perl 
nom_script. 

%s: Expression syntax 

(%s: Syntaxe d'expression) 

(A) Vous avez lance accidentellement votre script avec csh au lieu de Perl. Verifiez 
la ligne avec # ! ou lancez vous-meme votre script manuellement dans Perl avec perl 
nom_script. 

%s: Undefined variable 

(%s: Variable indefinie) 

(A) Vous avez lance accidentellement votre script avec csh au lieu de Perl. Verifiez 
la ligne avec # ! ou lancez vous-meme votre script manuellement dans Perl avec perl 
nom_script. 
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%s: not found 
(%s: introuvable) 

(A) Vous avez lance accidentellement votre script avec le Bourne Shell au lieu de 
Perl. Verifiez la ligne avec # ! ou lancez vous-meme votre script manuellement dans 
Perl avec perl nom_script. 

(in cleanup) %s 

((au nettoyage) %s) 

(W misc) Ce prefixe indique habituellement qu'une methode DESTROY a leve 
l'exception indiquee. Puisque les destructeurs sont appeles habituellement par le 
systeme a un moment arbitraire durant l'execution, et bien souvent un grand nom- 
bre de fois, cet avertissement n'est affiche qu'une seule fois pour tous les echecs qui 
sinon auraient cause une repetition du meme message. 

Les echecs des fonctions de rappel (callbacks) definies par l'utilisateur et propagees 
par l'emploi du flag C_KEEPERR peuvent egalement entrainer cet avertissement. 
Voir perlcall(\). 

(Missing semicolon on previous line?) 

(Point-virgule manquant sur la ligne precedente ?) 

(S) II s'agit d'une supposition donnee en complement du message « %s found 
where operator expected ». Pour autant, n'ajoutez pas systematiquement un 
point-virgule simplement parce que vous avez lu ce message 

-P not allowed for setuid/setgid script 

(-P n'est pas autorise pour un script setuid/setgid) 

(F) Le preprocesseur C a voulu ouvrir le script en l'appelant par son nom, ce qui 
entraine une situation de concurrence (N.d.T. : race condition) qui casse la securite. 

-T and -B not implemented on filehandles 

(-T et -B ne sont pas implementes sur les handles de fichiers) 
(F) Perl ne peut utiliser le tampon d'entree/sortie du handle de fichier quand il ne 
connait pas votre type d'entrees/sorties standards. Vous devez utiliser un nom de 
fichier a la place. 

-p destination: %s 

(Destination de -p : %s) 

(F) Une erreur est survenue durant l'affichage sur la sortie standard implicite invo- 
quee par l'option de la ligne de commande -p. (Cette sortie est redirigee vers 
STDOUT a moins que vous ne Fayez redirigee avec select.) 

500 Server error 

(Erreur de serveur 500) 

Voir Server error (Erreur de serveur). 
?+* follows nothing in regexp 

(?+* ne suivent rien dans l'expression reguliere) 

(F) Vous avez commence une expression rationnelle avec un quantifiant. Mettez un 
antislash devant si vous vouliez l'employer au sens litteral. 
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@ outside of string 

(@ a l'exterieur de la chame) 

(F) Vous aviez un canevas empaquete qui specifiait une position absolue en dehors 
de la chame a depaqueter. 

<> should be quotes 

(< > devraient etre des apostrophes) 

(F) Vous avez ecrit require <fichier> alors que vous auriez du ecrire require 
'fichier'. 

\1 better written as $1 

(II est preferable d'ecrire $1 plutot que \1) 

(W syntax) A l'exterieur des motifs, les references arrieres (backreferences) existent 
en tant que variables. L'utilisation d'antislashs du cote droit d'une substitution etait 
autorisee pour nos grands-peres, mais stylistiquement, il mieux vaut adopter la 
forme des variables attendue par les autres programmeurs Perl. De plus, cela fonc- 
tionne mieux s'il y a plus de neuf references arrieres. 

acceptQ on closed socket %s 

(acceptQ sur une socket fermee %s) 

(W closed) Vous avez tente de faire un accept sur une socket fermee. Peut-etre avez- 
vous oublie de verifier la valeur retournee par l'appel de socket ? 

Allocation too large: %lx 

(Allocation trop grande : %lx) 

(X) Vous ne pouvez allouer plus de 64K sur une machine MS-DOS. 
Applying %s to %s will act on scalar(%s) 

(Appliquer^s k%s fonctionne avec un scalaire (%s)) 

(W misc) Les operateurs de recherche de correspondance (//), de substitution 
(s///) et de translation (tr///) fonctionnent avec des valeurs scalaires. Si vous 
appliquez l'un d'eux a un tableau ou a un hachage, il convertit ce dernier en une 
valeur scalaire — la longueur du tableau ou les informations sur le peuplement du 
hachage — puis travaille sur la valeur scalaire. Ce n'est probablement pas ce que 
vous vouliez faire. 

Arg too short for msgsnd 

(Argument trop court pour msgsnd) 

(F) msgsnd necessite une chame au moins aussi longue que sizeof (long). 
Ambiguous use of %s resolved as %s 

(Utilisation ambigue de %s resolue avec %s) 

(W ambiguous | S) Vous avez exprime quelque chose qui n'est pas interprets 
comme vous le pensiez. Normalement il est assez facile de clarifier la situation en 
rajoutant une apostrophe manquante, un operateur, une paire de parentheses ou 
une declaration. 
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Ambiguous call resolved as C0RE::%s(), qualify as such or use & 
(Appel ambigu resolu avec CORE : :%s, qualifiez le ainsi ou utiliser &) 
(W ambiguous) Un sous-programme que vous avez declare a le meme nom qu'un 
mot clef de Perl et vous avez utilise ce nom sans le qualifier pour que Ton puisse 
distinguer l'un de l'autre. Perl decide d'appeler la fonction interne car votre sous- 
programme n'est pas importe. 

Pour forcer Interpretation sur l'appel de votre sous-programme, mettez une esper- 
luette avant le nom ou qualifiez votre sous-programme avec son nom de paquetage. 
Ou alors, vous pouvez importer le sous-programme (ou pretendre le faire avec le 
pragma use subs). 

Pour l'interpreter en silence comme l'operateur Perl, utilisez le prefixe CORE : : sur 
cet operateur (ex. CORE: : log ($x)) ou declarez le sous-programme en tant que 
methode objet. 

Args must match #! line 

(Les arguments doivent correspondre a la ligne # ! ) 

(F) L'emulateur setuid necessite que les arguments invoques par Perl correspon- 
dent avec ceux utilise sur la ligne # ! . Comme certains systemes imposent un unique 
argument sur la ligne # ! , essayez de combiner les options ; par exemple, changez -w 
-U en -wU. 

Argument "%s" isn't numeric 

(L'argument "%s" n'est pas numerique) 

(W numeric) La chaine indiquee est utilisee comme un argument avec un opera- 
teur qui s'attend plutot a une valeur numerique. Si vous etes chanceux, le message 
indique quel operateur a ete si malchanceux. 

Array <ti>%s missing the @ in argument %d of %s() 

(D deprecated) Les versions vraiment anterieures de Perl permettaient d'omettre le 
@ des tableaux a certains endroits. Ceci est maintenant largement obsolete. 

assertion botched: %s 

(assertion sabotee : %s) 

(P) Le paquetage malloc fourni avec Perl a subi une erreur interne. 
Assertion failed: file "%s" 

(L'assertion a echoue : fichier "%s") 

(P) Une assertion generale a echoue. Le fichier en question doit etre examine. 
Assignment to both a list and a scalar 

(Assignement simultane a une liste et a un scalaire) 

(F) Si vous affectez a un operateur conditionnel, les deuxieme et troisieme argu- 
ments doivent soit etre tous les deux des scalaires, soit tous les deux des listes. 
Autrement Perl ne connait pas le contexte a fournir au cote droit. 

Attempt to free non-arena SV: Ox%lx 

(Tentative de liberer un SV hors d'une zone : Ox%lx) 

(P internal) Tous les objets SV sont supposes etre alloues dans une zone qui sera 
nettoyee a la sortie du script. Un SV a ete decouvert en dehors d'une de ces zones. 
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Attempt to free nonexistent shared string 

(Tentative de liberer une chaine partagee inexistante) 

(P internal) Perl maintient une table interne qui compte les references de chaines 
pour optimiser le stockage et Faeces au clefs de hachages et aux autres chaines. Ce 
message indique que quelqu'un a essaye de decrementer le compteur de references 
d'une chaine que Ton ne peut plus trouver dans la table. 

Attempt to free temp prematurely 

(Tentative prematuree de liberer une valeur temporaire) 

(W debugging) Les valeurs a l'agonie (mortalized) sont supposees etre liberees par la 
routine interne free_tmps. Ce message indique que quelque chose d'autre est en 
train de liberer le SV avant que la routine f ree_tmps ait une chance de le faire, ce 
qui signifie que la routine f ree_tmps liberera un scalaire non reference au moment 
oil elle tentera de le faire. 

Attempt to free unreferenced glob pointers 

(Tentative de liberer des pointeurs de glob non references) 

(P internal) Le compteur de references a ete endommage en ce qui concerne les 
alias de symboles. 

Attempt to free unreferenced scalar 

(Tentative de liberer un scalaire non reference) 

(W internal) Perl allait decrementer un compteur de references d'un scalaire pour 
voir s'il arrivait a 0 et a decouvert qu'il etait deja arrive a 0 auparavant et qu'il se 
pourrait qu'il ait ete libere et, en fait, qu'il a probablement ete libere. Cela peut 
indiquer que SvREFCNT_dec a ete appele trop de fois ou que SvREFCNT_inc n'a pas 
ete appele assez de fois ou encore que le SV a ete acheve {mortalized) alors qu'il 
n'aurait pas du l'etre ou enfin que la memoire a ete corrompue. 

Attempt to join self 

(Tentative de se rejoindre soi-meme) 

(F) Vous avez essayer de rejoindre avec join une tache (thread) a partir d'elle-meme, 
ce qui est une operation impossible. Vous pourriez rejoindre la mauvaise tache ou 
avoir besoin de deplacer le join vers une autre tache. 

Attempt to pack pointer to temporary value 

(Tentative d'empaqueter un pointeur vers une valeur temporaire) 
(W pack) Vous avez essaye de passer une valeur temporaire (comme le resultat 
d'une fonction ou une expression calculee) au canevas p de pack. Cela signifie que 
le resultat contient un pointeur vers un endroit qui pourrait devenir invalide a tout 
moment, mime avant la fin de l'instruction en cours. Utilisez des valeurs litterales 
ou globales comme arguments du canevas p de pack pour eviter cet avertissement. 

Attempt to use reference as lvalue in substr 

(Tentative d'utiliser une reference en tant que lvalue dans substr) 
(W substr) Vous avez soumis une reference utilisee en tant que lvalue comme pre- 
mier argument de substr, ce qui est vraiment etrange. Peut-etre avez-vous oublie 
de la dereferencer en premier lieu. 
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Bad arg length for %s, is %d, should be %d 

(Mauvaise longueur d'argument pour %s, vaut %d, devrait valoir %d) 
(F) Vous avez passe un tampon de taille incorrecte a msgctl, semctl ou shmctl. En 
C, les tailles correctes sont respectivement sizeof (struct msqid_ds *), 
sizeof (struct semid_ds *) et sizeof (struct shmid_ds *). 

Bad evalled substitution pattern 

(Mauvaise evaluation du motif de substitution) 

(F) Vous avez utilise l'option /e pour evaluer l'expression de remplacement pour 
une substitution mais Perl a trouve une erreur de syntaxe dans le code a evaluer, 
tres certainement une parenthese fermante inattendue. 

Bad filehandle: %s 

(Mauvais handle de fichier : %s) 

(F) Un symbole a ete passe a quelque chose qui s'attendait a un handle de fichier 
mais le symbole n'a aucun handle de fichier qui lui soit associe. Peut-etre avez-vous 
oublie de faire un open ou dans vous Favez fait dans un autre paquetage. 

Bad free() ignored 

(Mauvais free() ignore) 

(S malloc) Une routine interne a appele free sur quelque chose qui n'avait jamais 
ete alloue avec malloc dans un premier temps. Ce message est obligatoire mais peut 
etre desactive en positionnant la variable d'environnement PERL_BADFREE a 1. 
Ce message peut etre assez frequent avec DB_f ile sur les systemes avec une edition 
de liens dynamiques en « dur », comme AIX et OS/2. C'est un bug de Berkeley DB. 

Bad hash 

(Mauvais hachage) 

(P) Une des routines internes concernant un hachage a passe un pointeur HV nul. 
Bad index while coercing array into hash 

(Mauvais indice lors de la transformation d'un tableau en hachage) 

(F) La recherche dans le hachage, Oeme element d'un pseudo-hachage, a decouvert 

un indice illegal. La valeurs des indices doit etre superieure ou egale a 1. 

Bad name after %s : : 

(Mauvais nom apres %s : : ) 

(F) Vous avez commence un nom de symbole en utilisant un prefixe de paquetage 
puis vous n'avez pas fini le symbole. En particulier, vous ne pouvez pas faire d'inter- 
polation en dehors des guillemets, ainsi : 

$var = 'ma^/ar'; 

$sym = mon_paquetage: :$var; 

n'est pas identique a : 
$var = 'ma^/ar'; 
$sym = "mon_paquetage: :$var"; 

Bad realloc() ignored 

(Mauvais reallocQ ignore) 
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(S malloc) Une routine interne a appele realloc sur quelque chose qui n'avait 
jamais ete alloue avec malloc dans un premier temps. Ce message est obligatoire 
mais peut etre desactive en positionnant la variable d'environnement 
PERL BADFREE a 1. 

Bad symbol for array 

(Mauvais symbole pour un tableau) 

(P) Une requete interne a demande a ajouter une entree de tableau a quelque 
chose qui n'est pas une entree dans la table des symboles. 

Bad symbol for filehandle 

(Mauvais symbole pour un handle de fichier) 

(P) Une requete interne a demande a ajouter une entree de handle de fichier a 
quelque chose qui n'est pas une entree dans la table des symboles. 

Bad symbol for hash 

(Mauvais symbole pour un hachage) 

(P) Une requete interne a demande a ajouter une entree de hachage a quelque 
chose qui n'est pas une entree dans la table des symboles. 

Badly placed ()'s 

(Parentheses mal disposees) 

(A) Vous avez lance accidentellement votre script avec csh au lieu de Perl. Verifiez 
la ligne avec # ! ou lancez vous-meme votre script dans Perl avec perl nom_script. 

Bareword "%s" not allowed while "strict subs" in use 
(Mot simple "%s" interdit lorsque "strict subs" est active) 
(F) Avec « strict subs » active, un mot simple n'est autorise que comme identifi- 
cateur de sous-programme, entre accolades ou a la gauche du symbole =>. Peut-etre 
devriez-vous declarer au prealable votre sous-programme ? 

Bareword "%s" refers to nonexistent package 

(Le mot simple "%s" se retere a un paquetage inexistant) 

(W bareword) Vous avez utilise un mot simple qualifie de la forme True: : mais le 
compilateur n'a pas vu d'autre utilisation de cet espace de noms avant cet endroit. 
Peut-etre devriez-vous declarer au prealable votre paquetage ? 

Bareword found in conditional 

(Mot simple detecte dans une condition) 

(W bareword) Le compilateur a trouve un mot simple la oil il attendait une condi- 
tion, ce qui indique souvent qu'un | | ou un && a ete analyse comme faisant partie 
du dernier argument de la construction precedente, par exemple : 
open F00 | | die; 

Cela peut egalement indique une constante mal orthographiee qui a ete interpre- 
tee en tant que mot simple : 

use constant TYPO => 1; 

if (TYOP) { print "true" } 
Le pragma strict est tres utile pour eviter de telles erreurs. 
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BEGIN failed—compilation aborted 

(Echec de BEGIN — compilation abandonnee) 

(F) Une exception non interceptable a ete levee pendant l'execution d'un sous-pro- 
gramme BEGIN. La compilation s'arrete immediatement et Ton quitte l'interpre- 
teur. 

BEGIN not safe after errors—compilation aborted 

(BEGIN non securise apres des erreurs — compilation abandonnee) 
(F) Perl a trouve un sous-programme BEGIN (ou une directive use, ce qui implique 
un BEGIN) apres qu'une ou plusieurs erreurs de compilation sont deja survenues. 
Comme l'environnement du BEGIN ne peut etre garanti (a cause des erreurs) et 
comme le code qui suit est susceptible de dependre de son bon fonctionnement, 
Perl rend la main. 

Binary number > Obllllllllllllllllllllllllllllllll non-portable 
(Nombre binaire >Obllllllllllllllllllllllllllllllll, non portable) 
(W portable) Le nombre binaire que vous avez specifie est plus grand que 2**31-1 
(4 294 967 295) et n'est done pas portable entre les systemes. 

bindQ on closed socket %s 
(bind sur une socket fermee %s) 

(W closed) Vous avez essaye de faire un bind sur une socket fermee. Peut-etre avez- 
vous oublie de verifier la valeur renvoyee par l'appel de socket ? 

Bit vector size > 32 non-portable 

(Taille de vecteur de bits >32, non portable) 

(W portable) L'utilisation de tailles de vecteurs de bits superieures a 32 n'est pas 
portable. 

Bizarre copy of %s in %s 

(Copie etrange de %s dans %s) 

(P) Perl a detecte une tentative de copie d'une valeur interne qui n'est pas copiable. 
Buffer overflow in prime_env_iter: %s 

(Depassement du tampon dans prime_env_iter : %s) 

(W internal) II s'agit d'un avertissement specifique a VMS. Pendant que Perl se pre- 
parait a parcourir %ENy il a rencontre un nom logique ou une definition de sym- 
bole qui etait trop long, il l'a done tronque vers la chaine indiquee. 

Callback called exit 

(La fonction de rappel a appele exit) 

(F) Un sous-programme invoque depuis un paquetage externe via call_sv s'est ter- 
minee en appelant exit. 

Can't "goto" out of a pseudo block 

("goto" impossible vers l'exterieur d'un pseudo-bloc) 

(F) Une instruction goto a ete executee pour quitter ce qui semblerait etre un bloc, 
excepte que ce n'est pas un bloc correct. Ceci se produit habituellement si vous 
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essayez de sauter hors d'un bloc sort ou d'un sous-programme, ce qui n'a pas de 
sens. 

Can't "goto" into the middle of a foreach loop 

("goto" impossible vers le milieu d'une boucle foreach) 

(F) Une instruction goto a ete executee pour sauter au milieu d'une boucle 
foreach. Vous ne pouvez y aller depuis cet endroit. 

Can't "last" outside a loop block 

("last" impossible vers l'exterieur d'un bloc de boucle) 

(F) Une instruction last a ete executee pour sortir du bloc courant, excepte ce leger 
probleme qu'il n'existe pas de bloc courant. Remarquez que les blocs if ou else ne 
comptent pas comme des blocs de boucle, tout comme tout comme les blocs passes 
a sort, map ou grep. Vous pouvez habituellement doubler les accolades pour obte- 
nir le meme effet, car les accolades interieures seront considerees comme un bloc 
qui boucle une seule fois. 

Can't "next" outside a loop block 

("next" impossible vers l'exterieur d'un bloc de boucle) 

(F) Une instruction next a ete executee pour recommencer le bloc courant mais il 
n'existe pas de bloc courant. Remarquez que les blocs if ou else ne comptent pas 
comme des blocs de boucle, tout comme les blocs passes a sort, map ou grep. Vous 
pouvez habituellement doubler les accolades pour obtenir le meme effet, car les 
accolades interieures seront considerees comme un bloc qui boucle une seule fois. 

Can't read CRTL environ 

(Impossible de lire l'environnement de CRTL) 

(S) II s'agit d'un avertissement specifique a VMS. Perl a essaye de lire un element de 
%ENV depuis le tableau d'environnement interne de CRTL et a decouvert que le 
tableau n'existait pas. Vous devez determiner ou CRTL a incorrectement place son 
environnement ou definir PERL_ENV_TABLES (voir perlvms(\)) pour que le tableau 
d'environnement ne soit pas recherche. 

Can't "redo" outside a loop block 

("redo" impossible vers l'exterieur d'un bloc de boucle) 

(F) Une instruction redo a ete executee pour recommencer le bloc courant mais il 
n'existe pas de bloc courant. Remarquez que les blocs if ou else ne comptent pas 
comme des blocs de boucle, tout comme les blocs passes a sort, map ou grep. Vous 
pouvez habituellement doubler les accolades pour obtenir le meme effet, car les 
accolades interieures seront considerees comme un bloc qui boucle une seule fois. 

Can't bless non-reference value 

(Impossible de consacrer avec bless une valeur qui ne soit pas une reference) 

(F) Seules les references en dur peuvent etre consacrees avec bless. C'est de cette 

maniere que Perl « applique » l'encapsulation des objets. 

Can't break at that line 

(Impossible de s'arreter a cette ligne) 

(S internal) II s'agit d'un message d'erreur qui n'est affiche que lorsque le pro- 
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gramme s'execute avec le debogueur, indiquant que le numero de ligne specifie 
n'est pas l'emplacement d'une instruction a laquelle on peut s'arreter. 

Can't call method "%s" in empty package "%s" 

(Impossible d'appeler la methode "%s" dans le paquetage vide "%s") 
(F) Vous avez appele une methode correctement et vous avez indique correctement 
le paquetage pris en tant que classe, mais ce paquetage n'a rien de defini et n'a pas 
de methodes. 

Can't call method "%s" on unblessed reference 

(Impossible d'appeler la methode "%s" sur une reference non consacree avec bless) 
(F) Un appel de methode doit connaitre depuis quel paquetage elle est suppose etre 
lancee. II trouve habituellement ceci dans la reference de Fobjet que vous soumet- 
tez mais vous n'avez pas fourni de reference d'objet dans ce cas. Une reference n'est 
pas une reference d'objet jusqu'a ce qu'elle ait ete consacree (avec bless). 

Can't call method "%s" without a package or object reference 

(Impossible d'appeler la methode "%s" dans un paquetage ou une reference 
d'objet) 

(F) Vous avez utilise la syntaxe d'un appel de methode mais la place reservee a la 
reference d'objet ou au nom du paquetage contient une expression qui retourne 
une valeur definie qui n'est ni une reference d'objet ni un nom de paquetage. Quel- 
que chose comme ceci reproduira l'erreur : 

$MAUVAISE_REF = 42; 

traite $MAUVAISE_REF 1,2,3; 

$MAUVAISE_REF->traite(l,2,3); 

Can't call method "%s" on an undefined value 

(Impossible d'appeler la methode "%s" sur une valeur indefinie) 
(F) Vous avez utilise la syntaxe d'un appel de methode, mais la place reservee a la 
reference d'objet ou au nom du paquetage contient une une valeur indefinie. Quel- 
que chose comme ceci reproduira l'erreur : 

$MAUVAISE_REF = undef; 

traite $MAUVAISE_REF 1,2,3; 

$MAUVAISE_REF->traite(l,2,3); 

Can't chdir to %s 

(chdir impossible vers %s) 

(F) Vous avez appele perl -x/truc/bidule, mais /truc/bidule n'est pas un repertoire dans 
lequel vous pouvez rentrer avec chdir, probablement parce qu'il n'existe pas. 

Can't check filesystem of script "%s" for nosuid 

(Impossible de verifier le nosuid pour le systeme de fichier du script "%s") 

(P) Pour une raison ou pour une autre, vous ne pouvez pas verifier le nosuid pour 

le systeme de fichier du script. 

Can't coerce %s to integer in %s 

(Impossible de convertir %s vers un entier dans %s) 

(F) On ne peut pas forcer certain types de SV en particulier les entrees de la table 
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des symboles (typeglobs) a cesser d'etre ce qu'ils sont. Done vous ne pouvez pas 
faire des choses telles que : 

*truc += 1; 
Vous pouvez ecrire : 

$truc = *truc; $truc += 1; 
mais alors $truc ne contient plus de glob. 
Can't coerce %s to number in %s 

(Impossible de convertir %s vers un nombre dans %s) 

(F) On ne peut pas forcer certain types de SVs, en particulier les entrees de la table 
des symboles (typeglobs) a cesser d'etre ce qu'ils sont. 

Can't coerce %s to string in %s 

(Impossible de convertir %s vers une chame dans^s) 

(F) On ne peut pas forcer certain types de SVs, en particulier les entrees de la table 
des symboles (typeglobs) a cesser d'etre ce qu'ils sont. 

Can't coerce array into hash 

(Impossible de convertir un tableau vers un hachage) 

(F) Vous avez utilise un tableau la oil un hachage etait attendu, mais le tableau n'a 
pas d'informations sur la maniere de passer des cles aux indices de tableau. Vous ne 
pouvez faire cela qu'avec les tableaux qui ont une reference de hachage a l'indice 0. 

Can't create pipe mailbox 

(Impossible de creer un pipe de boite aux lettres) 

(P) II s'agit d'une erreur specifique a VMS. Le processus souffre de quotas depasses 
ou d'autres problemes de plomberie. 

Can't declare class for non-scalar %s in "%s" 

(Impossible de declarer une classe pour le non-scalaire %s dans "%s") 
(S) Actuellement, seules les variables scalaires peuvent etre declaree avec un qualifi- 
cateur de classe specifique dans une declaration my ou our. Les semantiques peu- 
vent etre etendues a d'autres types de variables a l'avenir. 

Can't declare %s in "%s" 

(Impossible de declarer^ dans "%s") 

(F) Seuls les scalaires, les tableaux et les hachages peuvent etre declares comme 
variables my ou our. lis doivent avoir un identificateur ordinaire comme nom. 

Can't do inplace edit on %s: %s 

(Impossible d'editer sur place %s) 

(S inplace) La creation du nouveau fichier a echoue a cause de la raison indiquee. 
Can't do inplace edit without backup 

(Impossible d'editer sur place sans copie de sauvegarde) 

(F) Vous etes sur un systeme comme MS-DOS qui s'embrouille si vous essayez de 
lire un fichier supprime (mais toujours ouvert). Vous devez ecrire -i.bak, ou quel- 
que chose comme ca. 
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Can't do inplace edit: %s would not be unique 

(Impossible d'editer sur place : %s ne serait pas unique) 

(S inplace) Votre systeme de fichier ne supporte pas les noms de fichiers plus longs 
que 14 caracteres et Perl n'a pas pu creer un nom de fichier unique durant l'edition 
sur place avec l'option -i. Ce fichier a ete ignore. 

Can't do inplace edit: %s is not a regular file 

(Impossible d'editer sur place : %s n'est pas un fichier ordinaire) 

(S inplace) Vous avez essaye d'utiliser l'option -i sur un fichier special, comme un 

fichier A&ns/dev ou une FIFO. Le fichier a ete ignore. 

Can't do setegid! 

(setegid impossible !) 

(P) L'appel a setegid a echoue pour une raison ou pour une autre dans l'emulateur 
setuid de suidperl. 

Can't do seteuid! 

(seteuid impossible !) 

(P) L'emulateur setuid de suidperl a echoue pour une raison ou pour une autre. 
Can't do setuid 

(setuid impossible) 

(F) Cela veut generalement dire que le perl ordinaire a essaye de faire exec suidperl 
pour emuler le setuid, mais n'a pas pu faire le exec. II cherche un nom de la forme 
sperl5.000 dans le meme repertoire que celui ou reside l'executable perl sous le 
nom perl5.000, generalement /usr/local/bin sur les machines Unix. Si le fichier s'y 
trouve, verifiez les permissions d'execution. S'il n'est pas la, demandez a votre 
administrateur systeme pourquoi. 

Can't do waitpid with flags 

(waitpid impossible avec les drapeaux) 

(F) Cette machine n'a pas ni waitpid ni wait4, ainsi seul waitpid sans aucun dra- 
peau est emule. 

Can't do {n,m} with n > m 

(Impossible de faire {n,m} avec n > m) 

(F) Les minima doivent etre inferieurs ou egaux aux maxima. Si vous voulez vrai- 
ment que votre expression reguliere corresponde 0 fois, faites juste {0}. 

Can't emulate -%s on #! line 

(Impossible d'emuler -%s sur la ligne # ! ) 

(F) La ligne # ! specifie une option qui n'a pas de sens a cet endroit. Par exemple, il 
serait un peu idiot de mettre l'option -x sur cette ligne #! . 

Can't exec "%s": %s 

(exec de "%s" impossible : %s) 

(W exec) L'appel a system, exec, ou open sur un pipe n'a pu s'executer pour la rai- 
son indiquee. Les raisons typiques incluent de mauvaises permissions sur le fichier, 
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que le fichier n'a pu etre trouve dans $ENV{PATH}, que l'executable en question a ete 
compile pour une autre architecture ou que la ligne # ! pointe vers un interpreteur 
qui ne peux pas etre lance pour des raisons similaires. (Ou peut-etre votre systeme 
ne supporte pas du tout # ! ). 

Can't exec %s 

(exec %s impossible) 

(F) Perl a essaye d'executer le programme indique pour vous car c'est ce qui est spe- 
cific sur la ligne # ! . Si ce n'est pas ce que vous vouliez, vous devrez mentionner 
perl quelque part sur la ligne # ! . 

Can't execute %s 

(Impossible d'executer %s) 

(F) Vous avez utilise l'option -S, mais les copies du script a executer trouvees dans le 
PATH n'ont pas les bonnes permissions. 

Can't find %s on PATH, '.' not in PATH 

(Impossible de trouver %s dans le PATH, " . " n'est pas dans le PATH) 
(F) Vous avez utilise l'option -S, mais le script a executer ne peut etre trouve dans le 
PATH ou tout au moins avec des permissions incorrectes. Le script existe dans le 
repertoire courant, mais le PATH l'empeche de se lancer. 

Can't find %s on PATH 

(Impossible de trouver %s dans le PATH) 

(F) Vous utilisez l'option -S, mais le script a executer ne peut etre trouve dans le 
PATH. 

Can't find an opnumber for "%s" 

(Impossible de trouver un numero d'operation pour "%s") 

(F) Une chaine de la forme CORE : :mot a ete donnee a prototype mais il n'existe pas 
de fonction interne nommee mot. 

Can't find label %s 

(Impossible de trouver l'etiquette %s) 

(F) Vous avez dit par un goto d'aller a une etiquette qui n'est mentionnee a aucun 
endroit oil il nous est possible d'aller. 

Can't find string terminator %s anywhere before EOF 

(Impossible de trouver la fin de la chaine %s quelque part avant EOF) 
(F) Les chaines de caracteres en Perl peuvent s'etirer sur plusieurs lignes. Ce mes- 
sage signifie que vous avez oublie le delimitateur fermant. Comme les parentheses 
protegees par des apostrophes comptent pour un niveau, il manque dans l'exemple 
suivant la parenthese finale : 

print q(Le caractere '(' commence une nouvelle citation.); 
Si vous obtenez cette erreur depuis un document « ici-meme » (N.d.T. : here docu- 
ment), vous devez avoir mis des espaces blancs non visibles avant ou apres la mar- 
que de fermeture. Un bon editeur pour les programmeurs devrait pouvoir vous 
aider a trouver ces caracteres. 
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Can't fork 

(fork impossible) 

(F) Une erreur fatale est survenue en essayant de faire un fork. 
Can't get filespec - stale stat buffer? 

(Impossible d'obtenir la specification du fichier — tampon stat perime ?) 
(S) II s'agit d'un avertissement specifique a VMS. Ceci arrive a cause des differences 
entre les controles d'acces sous VMS et sous le modele Unix qui est celui que Perl 
presuppose. Sous VMS, les controles d'acces sont fait par le nom de fichier, plutot 
que par les bits du tampon de stat, ce qui fait que les ACL et les autres protections 
peuvent etre pris en compte. Malheureusement, Perl presuppose que le tampon de 
stat contient toutes les informations necessaires et le fournit, a la place de la speci- 
fication du fichier, a la fonction de controle d'acces. II va essayer d'obtenir les speci- 
fications du fichier en utilisant le nom du peripherique et le FID presents dans le 
tampon de stat, mais si vous avez fait ensuite un appel a la fonction stat de CRTL, 
cela ne fonctionnera pas car le nom du peripherique est erase a chaque appel. Si 
cet avertissement apparait, la recherche de nom a echoue et la fonction de controle 
d'acces a rendu la main en retournant une valeur fausse, histoire d'etre un peu con- 
servateur. (Remarque : la fonction de controle d'acces connait l'operateur stat de 
Perl et les tests de fichiers, vous ne devriez done jamais voir cet avertissement en 
reponse a une commande Perl ; il ne se produit que si du code interne prend les 
tampons de stat a la legere.) 

Can't get pipe mailbox device name 

(Impossible d'obtenir le nom de peripherique d'un pipe de boite aux lettres) 
(P) Il s'agit d'une erreur specifique a VMS. Apres avoir cree une boite aux lettres se 
comportant comme un pipe, Perl ne peut obtenir son nom pour un usage ulte- 
rieur. 

Can't get SYSGEN parameter value for MAXBUF 

(Impossible d'obtenir la valeur du parametre SYSGEN pour MAXBUF) 

(P) II s'agit d'une erreur specifique a VMS. Perl a demande a $GETSYI quelle taille 

vous voulez pour vos tampons de boites aux lettres et il n'a pas obtenu de reponse. 

Can't goto subroutine outside a subroutine 

(goto vers un sous-programme impossible a l'exterieur d'un sous-programme) 
(F) L'appel hautement magique goto SOUS_PROGRAMME ne peut que remplacer 
l'appel d'une fonction par une autre. II ne peut en fabriquer une brute de fonderie. 
En general, vous ne devriez de toute facon l'appeler que depuis une fonction 
d'AUTOLOAD. 

Can't goto subroutine from an eval-string 

(goto vers un sous-programme impossible depuis une chaine eval) 
(F) L'appel goto SOUS_PROGRAMME ne peut etre utilise pour sortir d'une chame eval. 
(Vous pouvez l'utilisez pour sortir d'un eval BLOC mais ce n'est probablement pas 
ce que vous voulez.) 
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Can't ignore signal CHLD, forcing to default 

(Impossible d'ignorer le signal CHLD, la valeur par defaut est forcee) 
(W signal) Perl a detecte qu'il avait ete lance avec le signal SIGCHLD (quelquefois 
appele SICCLD) desactive. Comme la deactivation de ce signal va interferer avec 
une determination correcte du statut de sortie des processus fils, Perl a remis le 
signal a sa valeur par defaut. Cette situation indique generalement que le pro- 
gramme pere sous lequel Perl pourrait tourner (exemple : cron) est tres peu precau- 
tionneux. 

Can't localize through a reference 

(Impossible de rendre locale via une reference) 

(F) Vous avez ecrit quelque chose comme local $$ref , ce que Perl ne sait actuelle- 
ment pas gerer car quand il va restaurer l'ancienne valeur de ce vers quoi $ref poin- 
tait apres que la portee du local est terminee, il ne peut etre star que $ref soit 
toujours une reference. 

Can't localize lexical variable %s 

(Impossible de rendre locale la variable %s) 

(F) Vous avez utilise local sur une variable qui a deja ete declaree auparavant 
comme une variable lexicale a l'aide de my. Ceci n'est pas permis. Si vous voulez ren- 
dre locale une variable de paquetage du meme nom, qualifiez-la avec le nom du 
paquetage. 

Can't localize pseudo-hash element 

(Impossible de rendre local un element de pseudo-hachage) 
(F) Vous avez ecrit quelque chose comme local $tab->{'clef '}, oil $tab est une 
reference vers un pseudo-hachage. Cela n'a pas encore ete implemente mais vous 
pouvez obtenir un effet similaire en rendant local l'element du tableau correspon- 
dant directement - local $tab-> [ $tab-> [o] { ' clef ' } ]. 

Can't locate auto/%s.al in @INC 

(Impossible de trouver auto/^s . al dans @>INC) 

(F) Une fonction (ou une methode) a ete appelee dans un paquetage qui autorise le 
chargement automatique mais il n'existe pas de fonction a charger automatique- 
ment. Les causes les plus probables sont une faute de frappe dans le nom de la fonc- 
tion ou de la methode ou un echec dans 1'AutoSplit du fichier, disons, lors du make 
install. 

Can't locate %s 

(Impossible de trouver %s) 

(F) Vous avez ecrit de faire un do (ou un require ou un use) sur un fichier qui n'a 
pu etre trouve. Perl cherche le fichier dans tous les emplacements mentionnes dans 
@INC, a moins que le nom du fichier ne precise son chemin complet. Peut-etre avez- 
vous besoin de positionner la variable d'environnement PERL5LIB ou PERL50PT 
pour indiquer oil se trouve la bibliotheque ou il est possible que le script ait besoin 
d'ajouter le nom de la bibliotheque a @INC. Ou enfin, vous avez peut-etre seule- 
ment mal epele le nom du fichier. 
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Can't locate object method "%s" via package "%s" 

(Impossible de trouver la methode objet "%s" via le paquetage %s) 
(F) Vous avez appele une methode correctement et vous avez correctement indique 
un paquetage fonctionnant comme une classe mais ce paquetage ne definit pas 
cette methode-la, ni aucune de ses classes de base. 

Can't locate package %s for @%s::ISA 

(Impossible de trouver le paquetage %s pour @%s : : ISA) 

(W syntax) Le tableau (5>ISA contient le nom d'un autre paquetage qui semble ne 
pas exister. 

Can't make list assignment to \%ENV on this system 
(Impossible d'assigner une liste a \%EIW sur ce systeme) 

(F) L'affectation d'une liste a %ENV n'est pas supporte sur certains systemes, notam- 
ment VMS. 

Can't modify %s in %s 

(Impossible de modifier^ dans^s) 

(F) Vous n'etes pas autorise a faire d'affectation sur l'element indique, ou a essayer 
de le changer autrement, comme avec une incrementation automatique. 

Can't modify non-lvalue subroutine call 

(Impossible de modifier un appel de sous-programme qui ne soit pas une lvalue) 
(F) Les sous-programmes destines a etre utilises dans un contexte de lvalue doivent 
etre declares en tant que tels. 

Can't modify nonexistent substring 

(Impossible de modifier une sous-chaine inexistante) 

(P) La routine interne qui fait l'affectation substr a capture un NULL. 

Can't msgrcv to read-only var 

(msgrcv d'une var en lecture seule impossible) 

(F) La cible d'un msgrcv doit etre modifiable pour etre utilisee comme un tampon 
de reception. 

Can't open %s: %s 

(Impossible d'ouvrir^s: %s) 

(S inplace) L'ouverture implicite d'un fichier via le handle de fichier <>, soit impli- 
citement via les options de la ligne de commande -n ou -p, soit explicitement, a 
echoue a cause de la raison indiquee. Habituellement c'est parce que vous n'avez 
pas les permissions en lecture sur le fichier que vous avez indique sur la ligne de 
commande. 

Can't open bidirectional pipe 

(Impossible d'ouvrir un pipe bidirectionnel) 

(W pipe) Vous avez essaye d'ecrire open(CMD, " | cmd | "), ce qui n'est pas supporte. 
Vous pouvez essayer Fun des nombreux modules de la bibliotheque Perl pour faire 
cela, comme IPC: : Open 2. Ou alors, dirigez la sortie du pipe dans un fichier en utili- 
sant > et ensuite lisez-le dans un handle de fichier different. 
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Can't open error file %s as stderr 

(Impossible d'ouvrir le fichier d'erreur %s comme stderr) 

(F) II s'agit d'une erreur specifique a VMS. Perl fait ses propres redirections de la 
ligne de commande et ne peut ouvrir le fichier specifie apres 2> ou 2>> sur la ligne 
de commande pour y ecrire. 

Can't open input file %s as stdin 

(Impossible d'ouvrir le fichier d'entree %s comme stdin) 

(F) II s'agit d'une erreur specifique a VMS. Perl fait ses propres redirections de la 
ligne de commande et ne peut ouvrir le fichier specifie apres < sur la ligne de com- 
mande pour y lire. 

Can't open output file %s as stdout 

(Impossible d'ouvrir le fichier de sortie %s comme stdout) 

(F) II s'agit d'une erreur specifique a VMS. Perl fait ses propres redirections de la 
ligne de commande et ne peut ouvrir le fichier specifie apres > ou >> sur la ligne de 
commande pour y ecrire. 

Can't open output pipe (name: %s) 

(Impossible d'ouvrir le pipe de sortie (nom : %s)) 

(P) II s'agit d'une erreur specifique a VMS. Perl fait ses propres redirections de la 
ligne de commande et ne peut ouvrir le pipe dans lequel envoyer les donnees desti- 
nees a STDOUT. 

Can't open perl script "%s": %s 

(Impossible d'ouvrir le script perl "%s" : %s) 

(F) Le script que vous avez specifie ne peut etre ouvert pour la raison indiquee. 
Can't redefine active sort subroutine %s 

(Impossible de redefinir le sous-programme de sort actif) 

(F) Perl optimise la gestion interne des sous-programmes de sort et garde des poin- 
teurs vers ceux-ci. Vous avez essaye de redefinir un de ces sous-programmes de sort 
alors qu'il etait actuellement actif, ce qui n'est pas permis. Si vous voulez vraiment 
faire cela, vous devez ecrire sort { &f one } @x au lieu de sort fonc @x. 

Can't remove %s: %s, skipping file 

(Impossible de supprimer^s: %s, fichier passe) 

(S inplace) Vous avez demande une edition sur place sans creer un fichier de sauve- 
garde. Perl a ete incapable de supprimer le fichier original pour le remplacer avec 
celui modifie. Le fichier a ete laisse inchange. 

Can't rename %s to %s: %s, skipping file 

(Impossible de renommer %s en %s: %s, fichier passe) 

(S inplace) Le renommage effectue par l'option -i a echoue pour une raison ou 
pour une autre, probablement parce que vous n'avez pas le droit d'ecrire dans le 
repertoire. 
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Can't reopen input pipe (name: %s) in binary mode 

(Impossible de rouvrir le pipe d 'entree (nom : %s) en mode binaire) 

(P) II s'agit d'une erreur specifique a VMS. Perl pensait que STDIN etait un pipe et a 

essaye de le rouvrir pour accepter des donnees binaires. Helas, cela a echoue. 

Can't resolve method "%s" overloading "%s" in paquetage "Is" 

(Impossible de resoudre la methode "%s" surchargeant "%s" dans le paquetage 
"%s") 

(F|P) Une erreur s'est produite lors de la resolution de la surcharge specifiee par un 
nom de methode (a l'inverse d'une reference de sous-programme) : aucune 
methode de ce nom ne peut etre appelee via ce paquetage. Si le nom de la methode 
est ???, il s'agit d'une erreur interne. 

Can't reswap uid and euid 

(Impossible d'echanger a nouveau l'uid et l'euid) 

(P) L'appel setreuid a echoue pour une raison ou pour une autre dans l'emulateur 
setuid de suidperl. 

Can't return outside a subroutine 

(return impossible a l'exterieur d'un sous-programme) 

(F) L'instruction return a ete executee dans le fil principal du code, c'est-a-dire la 
ou il n'y a aucun appel de sous-programme dont on peut revenir avec return. 

Can't return %s from lvalue subroutine 

(Impossible de renvoyer %s d'un sous-programme utilise comme lvalue) 
(F) Perl a detecte que la valeur renvoyee par un sous-programme utilise comme lva- 
lue est illegale (constante ou variable temporaire). C'est interdit. 

Can't stat script "%s" 

(stat du script impossible : %s) 

(P) Pour une raison ou pour une autre, vous ne pouvez faire de f stat sur le script 
meme si vous l'avez deja ouvert. Bizarre. 

Can't swap uid and euid 

(Impossible d'echanger l'uid et l'euid) 

(P) L'appel setreuid a echoue pour une raison ou pour une autre dans l'emulateur 
setuid de suidperl. 

Can't take log of %g 

(Impossible de calculer le log de %g) 

(F) Pour les nombres reels ordinaires, vous ne pouvez calculer le logarithme d'un 
nombre negatif ou nul. II existe toutefois un paquetage Math: : Complex livre en 
standard avec Perl, si c'est vraiment ce que vous voulez faire cela avec les nombres 
negatifs. 

Can't take sqrt of %g 

(Impossible de calculer la racine carree de %g) 

(F) Pour les nombres reels ordinaires, vous ne pouvez calculer la racine carree d'un 
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nombre negatif. II existe toutefois le paquetage Math: : Complex livre en standard 
avec Perl, si vous voulez vraiment faire cela. 

Can't undef active subroutine 

(undef du sous-programme actif impossible) 

(F) Vous ne pouvez rendre indefinie une fonction qui est actuellement utilisee. 
Cependant, vous pouvez la redefinir pendant qu'elle tourne et meme faire un 
undef sur le sous-programme redefini pendant que l'ancien tourne. Maintenant, 
c'est a vous de voir. 

Can't unshift 

(unshift impossible) 

(F) Vous avez essaye de faire un unshift sur un tableau « irreel » qui ne peut accep- 
ter cette operation, comme la pile principale de Perl. 

Can't upgrade that kind of scalar 

(Impossible de mettre a niveau ce type de scalaire) 

(P) La routine interne sv_upgrade a ajoute des « membres » a un SV ce qui fait 
qu'il se trouve dans une sorte de SV plus specialisee. Les differents types les plus Ale- 
ve's de SV sont cependant si specialises, qu'ils ne peuvent etre converti entre eux. Ce 
message indique qu'une telle conversion a ete tentee. 

Can't upgrade to undef 

(Impossible de mettre a niveau vers undef) 

(P) Le SV indefini represente le niveau zero de l'evolutivite. L'evolution vers undef 
indique une erreur dans le code appelant sv_upgrade. 

Can't use %%! because Errno.pm is not available 

(Impossible d'utiliser %%! car Errno.pm n'est pas disponible) 

(F) La premiere fois que le hachage % ! est utilise, Perl charge automatiquement le 
module Errno. On attend du module Errno qu'il se lie avec tie au hachage %\ pour 
fournir des noms symboliques pour les valeurs des numeros d'erreur de $ ! . 

Can't use "my %s" in sort comparison 

(Impossible d'utiliser "my %s" dans les comparaisons de sort) 
(F) Les variables globales $a et $b sont reservees pour les comparaisons de sort. 
Vous avez mentionne $a ou $b dans la meme ligne que les operateurs <=> ou cmp et 
la variable avait ete declaree precedemment en tant que variable lexicale. Soit qua- 
lifiez la variable de sort avec le nom de paquetage, soit renommez la variable lexi- 
cale. 

Can't use %s for loop variable 

(Impossible d'utiliser %s comme variable de boucle) 

(F) Seule une variable scalaire simple peut etre utilisee comme variable de boucle 
dans un foreach. 

Can't use %s ref as %s ref 

(Impossible d'utiliser la ref %s en tant que ref de %s) 

(F) Vous avez melange vos types de references. Vous devez dereferencer la reference 
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du type necessaire. Vous pouvez utilisez la fonction ref pour tester le type de la 
reference, si besoin. 

Can't use \%c to mean $%c in expression 

(Impossible d'utiliser \%c pour signifier %%c dans une expression) 
(W syntax) Dans une expression ordinaire, l'antislash est un operateur unaire qui 
cree une reference vers son argument. L'utilisation d'un antislash pour indiquer 
une reference arriere vers une sous-chame reussissant la correspondance n'est 
valide qu'a l'interieur du motif de l'expression reguliere. Essayer de faire cela dans 
un code ordinaire Perl produit une valeur qui s'affiche comme SCALAR (Oxdecaf). 
Utilisez la forme $1 a la place. 

Can't use bareword ("%s") as %s ref while "strict refs" in use 

(Impossible d'utiliser un mot simple ("%s") en tant que ref de %s pendant que 
"strict refs" estactif) 

(F) Les references en dur sont les seules autorisees par strict refs. Les references 
symboliques sont interdites. 

Can't use string ("%s") as %s ref while "strict refs" in use 

(Impossible d'utiliser une chaine ("%s") en tant que ref de %s pendant que "strict 
refs" est actif) 

(F) Les references en dur sont les seules autorisees par strict refs. Les references 
symboliques sont interdites. 

Can't use an undefined value as %s reference 

(Impossible d'utiliser une valeur indefinie comme reference de %s) 

(F) Une valeur utilisee soit comme une reference en dur, soit comme une reference 

symbolique doit avoir une valeur definie. Cela aide a debloquer certaines erreurs 

insidieuses. 

Can't use global %s in "my" 

(Impossible d'utiliser la variable globale %s dans "my") 

(F) Vous avez essaye de declarer une variable magique en tant que variable lexicale. 
Cela n'est pas permis car la variable magique ne peut etre liee qu'a un seul endroit 
(nomme variable globale) et il serait incroyablement confus d'avoir des variables 
dans votre programme qui ressemblent a des variables magiques mais qui n'en sont 
pas. 

Can't use subscript on %s 

(Impossible d'utiliser un indice sur^s) 

(F) Le compilateur a essaye d'interpreter une expression entre crochets en tant 
qu'indice. Mais a gauche des crochets, il y avait une expression qui ne ressemblait 
pas a une reference de tableau, ni a quoi que ce soit que Ton puisse indicer. 

Can't weaken a nonreference 

(Impossible d'affaiblir une non-reference) 

(F) Vous avez tente d'affaiblir quelque chose qui n'etait pas une reference. Seules les 
references peuvent etre affaiblies. 
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Can't x= to read-only value 

(x= impossible sur une valeur en lecture seule) 

(F) Vous avez essaye de repeter une valeur constante (souvent la valeur indefinie) 
avec un operateur d'affectation, ce qui implique de modifier la valeur elle meme. 
Peut-etre devriez-vous copier la valeur dans une variable temporaire, et repeter 
cela. 

Character class [:£s:] unknown 

(Classe de caracteres [ :%s: ] inconnue) 

(F) La classe dans la syntaxe pour une classe de caracteres [ : : ] est inconnue. 
Character class syntax [%s] belongs inside character classes 

(La syntaxe [%s] pour une classe de caracteres appartient aux classes de caracteres) 
(W unsafe) Les constructions de classes de caracteres [ : : ], [= =] et [ . . ] se ran- 
gent dans les classes de caracteres, par exemple : /[012[ : alpha: ]345] /- Remarquez 
que les constructions [= =] et [ . . ] ne sont pas implementees actuellement ; ce 
sont juste des places reservees pour de futures extensions. 

Character class syntax [. .] is reserved for future extensions 

(Syntaxe [ . . ] pour une classe de caractere reservee pour de futures extensions) 
(W regexp) A l'interieur des classes de caracteres dans les expressions regulieres ([ ] ), 
la syntaxe commencant par [ . et se terminant par . ] est reservee pour de futures 
extensions. Si vous avez besoin de representer de telles sequences de caracteres a 
l'interieur d'une classe de caracteres dans une expression reguliere, protegez simple- 
ment les crochets avec un anti-slash : \ [ . et . \ ] . 

Character class syntax [= =] is reserved for future extensions 

(Syntaxe [ = = ] pour une classe de caractere reservee pour de futures extensions) 
(W regexp) A l'interieur des classes de caracteres dans les expressions regulieres ([ ] ), 
la syntaxe commencant par [= et se terminant par =] est reservee pour de futures 
extensions. Si vous avez besoin de representer de telles sequences de caracteres a 
l'interieur d'une classe de caracteres dans une expression reguliere, protegez simple- 
ment les crochets avec un anti-slash : \ [ . et . \ ] . 

chmodQ mode argument is missing initial 0 

(II manque le 0 au debut de l'argument representant le mode de chmodQ) 
(W chmod) Un utilisateur novice aura tendance a ecrire : 
chmod 777, $fichier 

en ne realisant pas que 777 sera interprets comme un nombre decimal, equivalent 
a 01411. Les constantes octales sont introduites en les faisant debuter par un 0 en 
Perl, tout comme en C. 

Close on unopened file <%s> 

(Ferme un fichier non ouvert <%s>) 

(W) Vous avez essaye de fermer un descripteur de fichier qui n'avait jamais ete 
ouvert. 
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Compilation failed in require 

(Echec de la compilation dans require) 

(F) Perl n'a pas pu compiler le fichier specifie dans une instruction require. Perl 
utilise ce message generique lorsqu'aucune des erreurs rencontrees n'est assez grave 
pour arreter la compilation immediatement. 

Complex regular subexpression recursion limit exceeded 

(Limite de recursion pour les expressions regulieres complexes (%d) atteinte) 
(W regexp) Le moteur d'expressions regulieres utilise la recursion dans les situa- 
tions complexes ou les retours arrieres sont necessaires. La profondeur de la recur- 
sion est limitee a 32 766, ou peut-etre moins sur les architectures ou la pile ne peut 
croitre arbitrairement. (Les situations « simples » et « moyennes » peuvent etre 
gerees sans recursion et ne sont pas sujettes a une limite.) Essayez de raccourcir la 
chame examinee, faites des boucles dans le code Perl (exemple : avec while) plutot 
qu'avec le moteur d'expressions regulieres ou reecrivez l'expression reguliere pour 
qu'elle soit plus simple ou qu'elle contienne moins de retours arrieres. 

connectQ on closed socket %s 

(connect () sur une socket fermee %s) 

(W closed) Vous avez essaye de faire un connect sur une socket fermee. Peut-etre 
avez-vous oublie de verifier la valeur retournee par l'appel de socket? 

Constant is not %s reference 

(La constante n'est pas une reference de %s) 

(F) Une valeur constante (declaree peut-etre en utilisant le pragma use constant) 
est dereferencee mais equivaut a une reference d'un mauvais type. Le message indi- 
que le type de reference qui etait attendu. Ceci indique habituellement une erreur 
de syntaxe en dereferencant la valeur constante. 

Constant subroutine %s redefined 

(Sous-programme constant %s redefini) 

(S|W redefine) Vous avez redefini un sous-programme qui a ete designe auparavant 
comme etant en ligne (inlimng). 

Constant subroutine %s undefined 

(Sous-programme constant %s indefini) 

(W misc) Vous avez rendu indefini un sous-programme qui a ete designe aupara- 
vant comme etant en ligne (inlining). 

constant (^s): %s 

(constant^) :%s) 

(F) L'analyseur syntaxique a trouve des incoherences soit en tentant de definir une 
constante surchargee, soit en essayant de trouver le nom de caractere specifie dans 
la sequence d'echappement . . . }. Peut-etre avez-vous oublie de charger les prag- 
mas correspondants overload ou charnames. 

Copy method did not return a reference 

(La methode de copie n'a pas renvoye de reference) 
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(F) La methode qui surcharge = est boguee. 
C0RE::#s is not a keyword 

(CORE : :%s n'est pas un mot clef) 

(F) L'espace de noms CORE : : est reserve pour les mots clefs de Perl. 
Corrupt malloc ptr Ox%Ix at Ox%Ix 

(Pointeur de malloc Ox%lx corrompu en OxlZx) 

(P) Le paquetage malloc distribue avec Perl a eu une erreur interne, 
corrupted regexp pointers 

(Pointeurs d'expressions regulieres corrompus) 

(P) Le moteur d'expressions regulieres est devenu confus parce que le compilateur 
d'expressions regulieres lui a donne. 

corrupted regexp program 

(Programme d'expressions regulieres corrompu) 

(P) On a passe au moteur d'expressions regulieres un programme d'expression 
regulieres sans nombre magique valide. 

Deep recursion on subroutine "%s" 

(Recursion profonde pour le sous-programme "%s") 

(W recursion) Ce sous-programme s'est appele lui-meme (directement ou indirecte- 
ment) 100 fois de plus qu'il n'est revenu. Ceci indique probablement une recursion 
infinie, a moins que vous n'ecriviez un etrange programme de benchmark, auquel 
cas cela indique quelque chose d'autre. 

defined (@array) is deprecated 

(defined(@tableau) estdeprecie) 

(D deprecated) defined n'est habituellement pas tres utile sur les tableaux car il 
teste la presence d'une valeur scalaire indefinie. Si vous voulez voir si le tableau est 
vide, vous n'avez qu'a utiliser if (^tableau) { # pas vide }. 

defined(%hash) is deprecated 

(defined(%hachage) estdeprecie) 

(D deprecated) defined n'est habituellement pas tres utile sur les hachages car il 
teste la presence d'une valeur scalaire indefinie. Si vous voulez voir si le hachage est 
vide, vous n'avez qu'a utiliser if (%hachage) { # pas vide }. 

Delimiter for here document is too long 

(Le delimiteur pour le document « ici-meme » est trop long) 
(F) Dans une construction de document « ici-meme », comme <<TRUC, l'etiquette 
TRUC est trop longue pour que Perl puisse la gerer. II faut que vous soyez serieuse- 
ment tordu pour ecrire un code qui declenche cette erreur. 

Did not produce a valid header 
(N'a pas produit un en-tete valide) 
Voir Server error. 
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(Did you mean &%s instead?) 

(Avez-vous plutot voulu dire &%s ?) 

(W) Vous avez probablement fait reference a un sous-programme importe &TRUC en 
faisant $TRUC ou quelque chose du genre. 

(Did you mean "local" instead of "our"?) 

(Avez-vous voulu dire "local" plutot que "our" ?) 

(W misc) Souvenez-vous que our ne rend pas locale la variable declaree comme glo- 
bale. Vous l'avez redeclaree dans la meme portee lexicale, ce qui semble superf lu. 

(Did you mean $ or @ instead of %?) 

(Avez-vous voulu dire $ ou @ plutot que % ?) 

(W) Vous avez probablement ecrit %hachage{$clef } alors que vous pensiez 
$hachage{$clef } ou @hachage{(5)clef s}. D'un autre cote, peut-etre avez-vous juste 
voulu dire %hachage et vous vous etes laisses emporter. 

Died 

(Mort) 

(F) Vous avez appele a die une chaine vide (l'equivalent de die "") ou vous l'avez 
appele sans arguments et a la fois $@ et $_ etaient vides. 

(Do you need to predeclare %s?) 

(Avez-vous besoin de predeclarer #s) 

(S) II s'agit d'une supposition donnee en complement du message « %s found 
where operator expected ». Cela veut souvent dire qu'un nom de sous-pro- 
gramme ou de module a ete reference alors qu'il n'a pas encore ete defini. C'est 
peut etre un probleme d'ordre dans votre fichier ou parce qu'il manque une ins- 
truction sub, package, require ou use. Si vous referencez quelque chose qui n'est 
pas encore defini, en fait vous n'avez pas a definir le sous-programme ou le paque- 
tage avant cet endroit. Vous pouvez utilisez un sub true; ou un package TRUC; 
vide pour entrer une declaration « par avance ». 

Document contains no data 

(Le document ne contient pas de donnees) 

Voir Server error. 
Don't know how to handle magic of type "Ms' 

(Ne sait pas comment gerer la magie du type '#s') 

(P) On a jete un sort sur la gestion interne des variables magiques. 
do_study: out of memory 

(do_study : debordement de memoire) 

(P) Ce message aurait plutot du etre capture par saf emalloc. 
Duplicate free() ignored 

(Duplication de free() ignoree) 

(S malloc) Une routine interne a appele free sur quelque chose qui a deja ete 
libere. 



900 



Chapitre 33 — Messages de diagnostic 



elseif should be elsif 
(elseif devrait etre elsif) 

(S) II n'y a pas de mot-clef « elseif » en Perl car Larry pense que c'est tres laid. 
Votre code sera interprete comme une tentative d'appel a la methode nommee 
elseif pour la classe renvoyee par le bloc qui suit. Ce n'est surement pas ce que 
vous voulez. 

entering effective %s failed 

(L'entree dans %s effectif a echoue) 

(F) Alors que le pragma use filetest etait actif, l'echange entre les UID ou les 
GID reels et effectifs a echoue. 

Error converting file specification %s 

(Erreur en convertissant la specification de fichier %s) 

(F) II s'agit d'une erreur specifique a VMS. Comme Perl doit gerer des specifications 
de fichiers dans les syntaxes VMS ou Unix, il convertit celles-ci dans un format uni- 
que lorsqu'il doit les traiter directement. Soit vous avez passe des specifications de 
fichier invalides, soit vous avez trouve un cas que les routines de conversion ne 
gerent pas. Zut ! 

%s: Eval-group in insecure regular expression 

(%s : Groupe eval dans une expression reguliere non securisee) 

(F) Perl a detecte une donnee marquee en essayant de compiler une expression 

reguliere qui contient l'assertion de longueur zero (?{ ... }) , ce qui n'est pas 

securise. 

%s: Eval-group not allowed, use re 'eval' 

(%s : Groupe eval interdit, utilisez use re 'eval') 

(F) Une expression reguliere contenait l'assertion de longueur nulle (?{ ... }), 
mais cette construction est seulement permise quand le pragma use re 'eval' est 
actif. 

%s: Eval-group not allowed at run time 
(%s : Groupe eval interdit a l'execution) 

(F) Perl a essaye de compiler une expression reguliere contenant l'assertion de lon- 
gueur nulle (?{ ... }) a l'execution, comme il le ferait si le motif contenait des 
valeurs interpolees. Comme c'est un risque de securite, cela n'est pas permis. Si vous 
insistez, vous pouvez toujours le faire en construisant explicitement votre motif 
depuis une chaine interpolee a l'execution et l'utiliser dans un eval. 

Excessively long <> operator 

(Operateur < > excessivement long) 

(F) Le contenu d'un operateur <> ne doit pas exceder la taille maximum d'un iden- 
tificateur Perl. Si vous essayez seulement d'obtenir les extensions d'une longue liste 
de fichiers, essayez d'utiliser l'operateur glob ou mettez les noms de fichiers dans 
une variable et faites un glob dessus. 
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Execution of %s aborted due to compilation errors 

(Execution de %s abandonnee a cause d'erreurs de compilation) 
(F) Le message de resume final lorsqu'une compilation Perl echoue. 

Exiting eval via %s 
(Sortie d'un eval via %s) 

(W exiting) Vous etes sorti d'un eval d'une facon non conventionnelle, comme un 
goto ou une instruction de controle de boucle. 

Exiting format via %s 

(Sortie d'un format via %s) 

(W exiting) Vous etes sorti d'un format d'une facon non conventionnelle, comme 
un goto ou une instruction de controle de boucle. 

Exiting pseudoblock via %s 

(Sortie d'un pseudo-bloc via %s) 

(W exiting) Vous etes sorti d'une construction tout a fait speciale de bloc (comme 
un bloc ou un sous-programme de sort) d'une facon non conventionnelle, comme 
un goto, ou une instruction de controle de boucle. 

Exiting subroutine via %s 

(Sortie d'un sous-programme via %s) 

(W exiting) Vous etes sorti d'un sous-programme d'une facon non conventionnelle, 
comme un goto ou une instruction de controle de boucle. 

Exiting substitution via %s 

(Sortie d'une substitution via %s) 

(W exiting) Vous etes sorti d'une substitution d'une facon non conventionnelle, 
comme un goto ou une instruction de controle de boucle. 

Explicit blessing to " (assuming package main) 

(Consecration par bless explicite vers ' ' (paquetage principal main adopte)) 
(W misc) Vous avez consacre par bless une reference a une chame de longueur 
nulle. Cela a pour effet de consacrer la reference dans le paquetage principal main. 
Ce n'est pas habituellement ce que vous voulez. Pensez a fournir un paquetage 
cible par defaut, comme dans bless ($ref, $p || 'Mon_Paquetage'); 

false [] range "%s" in regexp 

(Faux intervalle [ ] "%s" dans l'expression reguliere) 

(W regexp) Un intervalle de classe de caracteres doit debuter et finir par un carac- 
tere litteral et non par une autre classe de caracteres comme \d ou [: alpha :]. Le - 
dans votre faux intervalle est interprets comme un - litteral. Pensez a proteger le - 
comme cela : \-. 

Fatal VMS error at %s, line %d 

(Erreur VMS fatale dans %s, ligne %d) 

(P) II s'agit d'une erreur specifique a VMS. II s'est passe quelque chose de facheux 
dans un service du systeme VMS ou dans une routine CRTL ; le statut de sortie de 
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Perl devrait fournir plus de details. Le nom de fichier dans at %s et le numero de 
ligne dans line %d vous indiquent quelle section du code source Perl a ete affectee. 

fcntl is not implemented 

(f cntl non implemente) 

(F) Votre machine n'implemente apparemment pas fcntl. Qu'est-ce que c'est que 
ca, un PDP-11 ou quelque chose de similaire ? 

Filehandle %s never opened 

(Handle de fichier %s jamais ouvert) 

(W unopened) Une operation d'entree/sortie a ete tentee sur un handle de fichier 
qui n'a jamais ete initialise. Vous devez faire un appel a open ou a socket ou appe- 
ler un constructeur du module FileHandle. 

Filehandle %s opened only for input 

(Handle de fichier %s ouvert seulement pour les entrees) 

(W io) Vous avez tente d'ecrire dans un handle de fichier ouvert en lecture seule. Si 
vous vouliez que ce soit un handle de fichier ouvert en lecture-ecriture, vous deviez 
Fouvrir avec +<, +> ou +>> au lieu de < ou rien du tout. Si vous desiriez uniquement 
ecrire dans le fichier, utilisez > ou >>. 

Filehandle %s opened only for output 

(Handle de fichier %s ouvert seulement pour les sorties) 

(W io) Vous avez tente de lire dans un handle de fichier ouvert en ecriture seule. Si 
vous vouliez que ce soit un handle de fichier ouvert en lecture-ecriture, vous deviez 
Fouvrir avec +<, +> ou +>> au lieu de < ou rien du tout. Si vous desiriez uniquement 
lire dans le fichier, utilisez <. 

Final $ should be \$ or $name 

($ final devrait etre \$ ou $nom) 

(F) Vous devez maintenant decider si le $ final dans une chaine devait etre inter- 
prete comme le signe dollar litteral ou s'il etait la pour introduire un nom de varia- 
ble s'averant manquer. Vous devez done ajouter soit l'antislash, soit le nom. 

Final @ should be \(5> or @name 

(@ final devrait etre \@ ou @nom) 

(F) Vous devez maintenant decider si le @ final dans une chaine devait etre inter- 
prets comme le signe arobase litteral ou s'il etait la pour introduire un nom de 
variable s'averant manquer. Vous devez done ajouter soit l'antislash, soit le nom. 

flockQ on close filehandle %s 

(f lock() sur un handle de fichier ferine %s) 

(W closed) Le handle de fichier sur lequel vous avez essaye de faire flock a ete lui- 
meme ferme quelque temps auparavant. Verifiez le flux logique de votre pro- 
gramme, flock agit sur des handles de fichiers. Avez-vous tente d'appeler flock sur 
un handle de repertoire du meme nom ? 

Format %s redefined 

(Format %s redefini) 
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(W redefine) Vous avez redefini un format. Pour supprimer cet avertissement, ecri- 
vez 



Format not terminated 
(Format inacheve) 

(F) Un format doit etre termine par une ligne contenant uniquement un point. 
Perl est arrive en fin de fichier sans trouver une telle ligne. 

Found = in conditional, should be == 

(= trouve dans une condition, devrait etre ==) 
(W syntax) Vous avez ecrit : 

if ($truc = 123) 
alors que vous vouliez dire : 

if ($truc == 123) 
(ou quelque chose de similaire). 

gdbm store returned %d, errno %d, key "%s" 

(Le stockage gdbm a renvoye %d, numero d'erreur %d, clef "%s ") 

(S) Un avertissement de l'extension CDBM_File indique qu'un stockage a echoue. 

gethostent not implemented 
(gethostent non implemente) 

(F) Votre bibliotheque C n'implemente apparemment pas gethostent, probable- 
ment parce que si elle le faisait, elle se sentirait moralement obligee de renvoyer 
chaque nom d'hote existant sur Internet. 

get#sname() on closed socket %s 

(get#sname( ) sur une socket fermee %s) 

(W closed) Vous avez essaye d'obtenir une socket ou une socket parente d'une soc- 
ket fermee. Peut-etre avez-vous oublie de verifier la valeur renvoyee par l'appel 
socket ? 

getpwnam returned invalid UIC %#o for user "%s" 

(getpwname a renvoye l'UIC %#0 invalide pour l'utilisateur "%s") 

(S) II s'agit d'un avertissement specifique a VMS. L'appel a sys$getuai, sous-jacent 

de l'operateur getpwnam, a retourne une UIC invalide. 

glob failed (%s) 
(Echec du glob) 

(W glob) Quelque chose s'est mal passe avec le(s) programme(s) externe(s) utilise(s) 
par glob et <*.c>. Habituellement, cela signifie que vous avez fourni un motif de 
glob qui a entraine l'echec du programme externe qui s'est termine avec un statut 
different de zero. Si le message indique que la sortie anormale a engendre une 
copie du cceur du programme (core dump), ceci peut egalement vouloir dire que 



{ 



} 



no warnings; 

eval "format NAME =... 
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votre csh (C shell) est corrompu. Si c'est le cas, vous devriez changer toutes les varia- 
bles se rapportant a csh dans config.sh. Si vous utilisez tcsh, changez les variables qui 
s'y referent comme si c'etait csh. (ex. full_csh='/usr/bin/tcsh') ; sinon, videz-les 
toutes (sauf d_csh qui devrait valoir 'undef ') pour que Perl croit qu'il manque csh. 
Dans tous les cas, une fois config.sh mis a jour, lancez ./Configure -S et reconstruisez 
Perl. 

Glob not terminated 
(Glob non termine) 

(F) L'analyseur lexical avuun signe inferieur a un endroit ou il s'attendait a trouver 
un terme, il recherche done le signe superieur correspondant et ne le trouve pas. Il 
y a des chances que vous ayez oublie des parentheses necessaires auparavant dans la 
ligne et que vous avez reellement voulu dire le symbole <. 

Global symbol "%s" requires explicit package name 

(Le symbole global "%s" exige un nom de paquetage explicite) 
(F) Vous avez ecrit use strict vars, ce qui indique que toutes les variables doivent 
soit avoir une portee lexicale (en utilisant my), soit etre declares au prealable en uti- 
lisant our, soit etre explicitement qualifiers pour dire a quel paquetage la variable 
globale appartient (en utilisant : :). 

Got an error from DosAllocMem 

(Erreur rencontree depuis DosAllocMem) 

(P) Il s'agit d'une erreur specifique a OS/2. Le plus probable est que vous employez 
une version obsolete de Perl, cette erreur ne devrait done jamais se produire de 
toute facon. 

goto must have label 

(goto doit avoir une etiquette) 

(F) Au contraire de next et de last, vous n'etes pas autorises a faire un goto vers 
une destination non specifiee. 

Had to create %s unexpectedly 

(A du creer %s de maniere inattendue) 

(S internal) Une routine a demande un symbole dans une table des symboles qui 
aurait du deja exister mais pour une raison ou pour une autre ce n'etait pas le cas 
elle a ete cree en urgence pour eviter une copie du cceur du programme (core 
dump). 

Hash Us missing the % in argument %d of %s() 

(II manque le % du hachage %%s dans l'argument %d de %s()) 

(D deprecated) Seules les versions de Perl vraiment anciennes vous permettaient 
d'omettre le % dans les noms de hachage a certains endroits. C'est maintenant large- 
ment obsolete. 

Hexadecimal number > Oxffffffff non- portable 

(Nombre hexadecimal > Oxffffffff, non portable) 

(W portable) Le nombre hexadecimal que vous avez specifie est plus grand que 
2**32-1 (4 294 967 295) et n'est done pas portable d'un systeme a l'autre. 
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Identifier too long 

(Identificateur trop long) 

(F) Perl limite la taille des identificateurs (noms des variables, fonctions, etc.) a 250 
caracteres environ pour les noms simples et un peu plus pour les noms composes 
(comme $A: :B). Vous avez depasse les limites de Perl. Les futures versions de Perl 
seront susceptibles d'eliminer ces limitations arbitraires. 

Ill-formed CRTL environ value "%s" 

(Valeur d'environnement de CRTL "%s" mal formee) 

(W internal) II s'agit d'un avertissement specifique a VMS. Perl a essaye de lire le 
tableau d'environnement interne de CRTL et a rencontre un element sans le sepa- 
rateur = utilise pour separer les clefs des valeurs. L'element est ignore. 

Ill-formed message in prime_env_iter: \%s\ 

(Message mal forme dans prime_env_iter : \%s |) 

(W internal) II s'agit d'un avertissement specifique a VMS. Perl a essaye de lire un 
nom logique ou une definition de symbole CLI en se preparant a parcourir %ENV et 
il n'a pas vu le separateur attendu entre les clefs et les valeurs, la ligne a done ete 
ignoree. 

Illegal character %s (carriage return) 
(Caractere illegal %s (retour chariot)) 

(F) D'ordinaire, Perl traite les retours chariots dans le texte du programme au 
meme titre que n'importe quel autre caractere d'espacement, ce qui signifie que 
vous ne devriez jamais voir cette erreur lorsque Perl a ete construit en utilisant les 
options standards. Pour une raison ou pour une autre, votre version de Perl semble 
avoir ete construite sans ce support. Parlez-en a votre administrateur Perl. 

Illegal division by zero 

(Division par zero illegale) 

(F) Vous avez essaye de diviser un nombre par 0. Soit quelque chose clochait dans 
votre logique, soit vous devez placer une condition pour vous preserver de cette 
entree denuee de sens. 

Illegal modulus zero 

(Modulo zero illegal) 

(F) Vous avez essaye de diviser un nombre par 0 pour obtenir le reste. La plupart 
des nombres ne peuvent faire cela gentiment. 

Illegal binary digit 

(Chiffre binaire illegal) 

(F) Vous avez utilise un chiffre autre que 0 ou 1 dans un nombre binaire. 
Illegal octal digit 
(Chiffre octal illegal) 

(F) Vous avez utilise un 8 ou un 9 dans un nombre octal. 
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Illegal binary digit %s ignored 
(Chiffre binaire illegal %s, ignore) 

(W digit) Vous avez essaye d'utiliser un chiffre autre que 0 ou 1 dans un nombre 
binaire. L'interpretation du nombre binaire s'est arretee avant le chiffre en cause. 

Illegal octal digit %s ignored 

(Chiffre octal illegal %s, ignore) 

(W digit) Vous avez peut-etre essaye d'utiliser un 8 ou un 9 dans un nombre octal. 
L'interpretation du nombre octal s'est arretee avant le 8 ou le 9. 

Illegal hexadecimal digit %s ignored 

(Chiffre hexadecimal illegal %s, ignore) 

(W digit) Vous avez essaye d'utiliser un caractere autre qui n'est ni entre 0 et 9, ni 
entre A et F, ni entre a et f dans un nombre hexadecimal. L'interpretation du nom- 
bre hexadecimal s'est arretee avant le caractere illegal. 

Illegal number of bits in vec 

(Nombre de bits illegal dans vec) 

(F) Le nombre de bits dans vec (le troisieme argument) doit etre une puissance de 
deux de 1 a 32 (ou 64 si votre plate-forme le supporte). 

Illegal switch in PERL50PT: %s 

(Option illegale dans PERL50PT : %s) 

(X) La variable d'environnement PERL50PT ne peut etre utilisee que pour position- 
ner les options suivantes : - [DIMUdmw] . 

In string, <jj>%s now must be written as \@%s 

(Dans une chame, @%s doit maintenant s'ecrire \@#s) 

(F) Perl essayait auparavant de deviner si vous vouliez un tableau interpole ou un @ 
litteral. II faisait ceci lorsque la chaine etait utilisee la premiere fois pendant l'execu- 
tion. Les chaines sont maintenant analysees a la compilation et les instances ambi- 
gues de @ doivent etre eclaircies, soit en prefixant par un antislash pour indiquer 
qu'il s'agit d'un litteral, soit en declarant (ou en utilisant) le tableau dans le pro- 
gramme avant la chaine (lexicalement). (Un jour un @ sans antislash sera simple- 
ment interprete comme une interpolation d'un tableau.) 

Insecure dependency in %s 

(Dependance non securisee dans %s) 

(F) Vous avez essaye de faire quelque chose que le mecanisme de marquage des 
variables n'a pas apprecie. Ce mecanisme de marquage est active quand vous execu- 
tez un script setuid ou setgid, ou lorsque vous specifiez -T pour l'activer explicite- 
ment. Le mecanisme de marquage etiquette toutes les donnees derivees 
directement ou indirectement de l'utilisateur, qui est considere indigne de votre 
confiance. Si l'une de ces donnees est utilisee dans une operation « dangereuse », 
vous obtenez cette erreur. 

Insecure directory in %s 

(Repertoire non securise dans %s) 



Chapitre 33 — Messages de diagnostic 



907 



(F) Vous ne pouvez utilisez system, exec ou un pipe ouvert vers un script setuid ou 
setgid si $ENV{PATH} contient un repertoire qui a les droits en ecriture pour tout le 
monde. 

Insecure $ENV{%s} while running %s 

($ENV{#s} non securise alors que %s est en train de tourner) 
(F) Vous ne pouvez utilisez system, exec ou un pipe ouvert vers un script setuid ou 
setgid si $ENV{PATH}, $ENV{IFS}, $ENV{CDPATH}, $ENV{ENV} ou $ENV{BASH_ENV} sont 
derives de donnees fournies (ou potentiellement fournies) par l'utilisateur. Le 
script doit positionner le chemin a une valeur connue, en utilisant une donnee 
digne de confiance. 

Integer overflow in %s number 

(Depassement d'entier dans le nombre %s) 

(W overflow) Le nombre hexadecimal, octal ou binaire que vous avez specific soit 
comme litteral, soit comme argument de hex ou oct est trop grand pour votre 
architecture. Sur les machines 32-bits ,les plus grands nombres hexadecimaux, 
octaux ou binaires representables sans depassement sont OxFFFFFFFF, 
037777777777 et Obllllllllllllllllllllllllllllllll, respectivement. Remar- 
quez que Perl eleve de maniere transparente tous les nombres vers une representa- 
tion interne en virgule f lottante — sujette a des erreurs de perte de precision dans 
les operation ulterieures. 

Internal inconsistency in tracking vforks 

(Incoherence interne dans la recherche des vforks) 

(S) II s'agit d'un avertissement specifique a VMS. Perl garde une trace du nombre 
de fois ou vous avez appele fork et exec, pour determiner si l'appel courant a exec 
devrait affecter le script en cours ou un sous-pro cessus (Voir « exec LIST » dans perl- 
vms(l)). De toute facon, ce compte est devenu perturbe, Perl fait done une supposi- 
tion et traite ce exec comme une requete pour terminer le script Perl et executer la 
commande specifiee. 

internal disaster in regexp 

(desastre interne dans une expression reguliere) 

(P) Quelque chose s'est tres mal passe dans l'analyseur d'expressions regulieres. 
internal urp in regexp at /%s/ 

(gloups interne dans une expression reguliere) 

(P) Quelque chose a tres mal tourne dans l'analyseur d'expressions regulieres. 
Invalid %s attribute: %s 
(Attribut %s invalide : %s) 

(F) L'attribut indique pour un sous-programme ou une variable n'a pas ete reconnu 
par Perl ou par un gestionnaire fourni par l'utilisateur. 

Invalid %s attributes: %s 

(Attributs %s invalides : %s) 

(F) Les attributs indiques pour un sous-programme ou une variable n'ont pas ete 
reconnus par Perl ou par un gestionnaire fourni par l'utilisateur. 



908 



Chapitre 33 — Messages de diagnostic 



invalid [] range "%s" in regexp 

(Intervalle [] "%s" invalide dans l'expression reguliere) 

(F) L'intervalle specific dans une classe de caracteres a un caractere de debut supe- 
rieur au caractere de fin. 

Invalid conversion in %s: "%s" 

(Conversion invalide dans %s : "%s") 

(W printf ) Perl ne comprend pas le format de conversion donne. 
Invalid separator character %s in attribute list 

(Caractere de separation %s invalide dans la liste d'attributs) 
(F) Quelque chose d'autre qu'un deux-points ou qu'un espacement a ete detecte 
entre les elements d'une liste d'attributs. Si Fattribut precedent avait une liste de 
parametres entre parentheses, peut-etre que cette liste s'est terminee trop tot. 

Invalid type in pack: '%s' 
(Fype invalide dans pack : '%s') 

(F) Le caractere donne n'est pas un type d'empaquetage valide. 

(W pack) Le caractere donne n'est pas un type d'empaquetage valide mais l'habi- 

tude etait de l'ignorer silencieusement. 

Invalid type in unpack: '%s' 
(Type invalide dans unpack : '%s') 

(F) Le caractere donne n'est pas un type de depaquetage valide. 

(W unpack) Le caractere donne n'est pas un type de depaquetage valide mais l'habi- 

tude etait de l'ignorer silencieusement. 

ioctl is not implemented 

(F) Votre machine n'implemente apparemment pas ioctl, ce qui est quelque peu 
surprenant de la part d'une machine qui supporte le C. 

junk on end of regexp 

(Dechets a la fin de l'expression reguliere) 

(P) L'analyseur d'expressions regulieres s'est embrouille. 
Label not found for "last %s" 

(Etiquette introuvable pour "last %s") 

(F) Vous avez nomine une boucle pour en sortir mais vous n'etes pas actuellement 
dans une boucle de ce nom, meme si vous comptez d'oii vous avez ete appele. 

Label not found for "next %s" 

(Etiquette introuvable pour "next %s") 

(F) Vous avez nomme une boucle pour effectuer l'iteration suivante mais vous 
n'etes pas actuellement dans une boucle de ce nom, meme si vous comptez d'oii 
vous avez ete appele. 

Label not found for "redo %s" 

(Etiquette introuvable pour "redo %s") 
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(F) Vous avez nomme une boucle pour recommencer l'iteration en cours mais vous 
n'etes pas actuellement dans une boucle de ce nom, meme si vous comptez d'ou 
vous avez ete appele. 

leaving effective %s failed 

(la sortie de %s effectif a echoue) 

(F) Alors que le pragma use filetest etait actif, l'echange entre les UID ou les 
GID reels et effectifs a echoue. 

listenQ on closed socket %s 

(listen () sur une socket fermee %s) 

(W closed) Vous avez essaye de faire un listen sur une socket fermee. Peut-etre 
avez-vous oublie de verifier la valeur renvoyee par votre appel a socket ? 

Lvalue subs returning %s not implemented yet 

(Sous-programmes en tant que lvalue retournant %s pas encore implemented) 

(F) A cause de limitations dans l'implementation actuelle, les valeurs de tableaux et 

de hachages ne peuvent pas etre renvoyees dans un contexte de lvalue. 

Malformed PERLLIB_PREFIX 
(PERLLIB_PREFIX malformee) 

(F) II s'agit d'une erreur specifique a OS/2. PERLLIB_PREFIX doit etre de la forme : 

prefixel ;prefixe2 
ou : 

prefixel prefixe2 

avec prefixel et prefixe2 non vides. Si prefixel est en fait un prefixe d'un che- 
min de recherche de bibliotheque interne, on lui substitue prefixeL L'erreur peut 
survenir si les composants ne sont pas trouves ou s'ils sont trop longs. Voir 
PERLLIB_PREFIX dans le fichier README.os2 inclus dans la distribution de Perl. 

Method for operation %s not found in package %s during blessing 

(La methode pour l'operation %s n'a pas ete trouvee dans le paquetage %s durant la 
consecration avec bless) 

(F) Une tentative a ete effectuee pour specifier une entree dans une table de sur- 
charge qui ne peut etre resolue par un sous-programme valide. 

Method %s not permitted 
(Methode %s interdite) 
Voir Server error. 

Might be a runaway multi-line %s string starting on line %d 

(%s pourrait etre une chaine galopant sur plusieurs lignes, debutant a la ligne %d) 
(S) Une suggestion indiquant que l'erreur precedente peut avoir ete causee par un 
separateur manquant dans une chame ou un motif car la chaine se fmissait even- 
tuellement plus tot sur la ligne courante. 

Misplaced _ in number 

(_ mal place dans un nombre) 
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(W syntax) Un caractere souligne dans une constante decimale n'etait pas sur une 
limite de 3 chiffres. 

Missing $ on loop variable 

($ manquant dans un variable de boucle) 

(F) Apparemment, vous avez programme en csh un peu trop longtemps. Les varia- 
bles en Perl sont toujours precedees du $, au contraire des shells, ou cela peut varier 
d'une ligne a l'autre. 

Missing %sbiace%s on \N{} 

(#saccolades#s manquantes sur \N{}) 

(F) Vous avez employe la mauvaise syntaxe de nom de caractere litteral 
\N{nom_caractere} a l'interieur d'un contexte de guillemets. 

Missing comma after first argument to %s function 

(Virgule manquante apres le premier argument de la fonction %s) 

(F) Alors que certaines fonctions vous permettent de specifier un handle de fichier 

ou un « objet indirect » avant la liste d'arguments, celle-ci n'en fait pas partie. 

Missing command in piped open 

(Commande manquante dans un open avec un pipe) 

(W pipe) Vous avez utilise la construction open(HF, " | commande") ou open(HF, 
"commande | " ) mais il manquait la commande ou alors elle etait vide. 

Missing name in "my sub" 

(Nom manquant dans "my sub") 

(F) La syntaxe reservee pour les sous-programmes de portee lexicale exige qu'ils 
aient un nom par lequel on puisse les trouver. 

(Missing operator before %s?) 

(Operateur manquant avant %s ?) 

(S) II s'agit d'une supposition donnee en complement du message « %s found 
where operator expected ». Souvent l'operateur manquant est une virgule. 

Missing right curly or square bracket 

(Accolade fermante ou crochet fermant manquant) 

(F) L'analyseur lexical a compte plus d'accolades ouvrantes ou de crochets ouvrants 
que d'accolades fermantes ou de crochets fermants. En regie generale, vous trouve- 
rez le signe manquant a cote de l'endroit oil vous venez d'editer. 

Modification of a read-only value attempted 

(Tentative de modification d'une valeur en lecture seule) 

(F) Vous avez essaye, directement ou indirectement, de changer la valeur d'une 
constante. Vous ne pouvez pas, bien entendu, essayer de faire 2 = 1 car le compila- 
teur intercepte ceci. Mais une autre facon simple de faire la meme chose est : 

sub mod { $_[0] = 1 } mod(2); 
Un autre moyen serait d'affecter a substr ce qui se trouve au-dela de la fin de la 
chaine. 
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Modification of non-creatable array value attempted, subscript %d 
(Tentative de modification d'une valeur de impossible a creer, indice %d) 
(F) Vous avez essaye de faire naitre une valeur de tableau et l'indice etait probable- 
ment negatif, meme en comptant a rebours depuis de la fin du tableau. 

Modification of non-creatable hash value attempted, subscript "%s" 

(Tentative de modification d'une valeur de hachage impossible a creer, indice "%s") 
(P) Vous avez essaye de faire naitre une valeur de hachage et elle n'a pu etre creee 
pour une raison particuliere. 

Module name must be constant 

(Le nom de module doit etre constant) 

(F) Seul un nom de module brut est permis comme premier argument d'un use. 
msg#s not implemented 
(msg^s non implemente) 

(F) Vous n'avez pas d'implementation de messages des IPC System V sur votre sys- 
teme. 

Multidimensional syntax %s not supported 

(Syntaxe multidimensionnelle %s non supportee) 

(W syntax) Les tableaux multidimensionnels ne s'ecrivent pas $truc[l,2,3]. Us 
s'ecrivent $truc[l] [2] [3], tout comme en C. 

Name "%s::%s" used only once: possible typo 

(Nom %s ::%s" utilise une seule fois : faute de frappe possible) 
(W once) Les fautes de frappe apparaissent frequemment sous la forme de noms de 
variable uniques. Si vous avez une bonne raison pour cela, vous n'avez qu'a men- 
tionner la variable a nouveau pour supprimer ce message. La declaration our est 
destinee a cela. 

Negative length 

(Longueur negative) 

(F) Vous avez essaye de faire une operation read/write/send/recv avec un tampon 
de longueur plus petite que 0. C'est difficile a imaginer. 

nested *?+ in regexp 

(*?+ imbrique dans l'expression reguliere) 

(F) Vous ne pouvez quantifier un quantifiant sans faire intervenir de parentheses. 
Done les choses comme **, +* ou ?* sont illegales. 

Remarquez cependant que les quantifiants de recherche de correspondance mini- 
mum, *?, +?, et ?? ressemblent a des des quantifiants imbriques mais ne le sont 
pas. 

No #! line 

(Pas de ligne # ! ) 

(F) L'emulateur setuid exige que le script possede une ligne valide de la forme # ! 
meme sur les machines ne supportant pas la construction # ! . 
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No %s allowed while running setuid 

(Pas de %s autorise alors que Ton tourne avec setuid) 

(F) Pour des questions de securite, certaines operations sont trop dangereuses pour 
etre executees, voire tentees, dans un script setuid ou setgid. Generalement, il y 
existera bien un autre moyen pour faire ce que vous voulez, c'est-a-dire que si ce 
moyen n'est pas securise, il est au moins securisable. 

No -e allowed in setuid scripts 

(pas de -e autorise dans les scripts setuid) 

(F) Un script setuid ne peut etre specifie par Futilisateur. 
No %s specified for -%c 

(Pas de %s specifie pour -%c) 

(F) L'option de la ligne de commande indiquee necessite un argument obligatoire 
mais vous n'en avez pas specifie. 

No comma allowed after %s 

(Pas de virgule autorisee apres^s) 

(F) Lorsqu'un operateur de liste a un handle de fichier ou un « object indirect », il 
ne doit pas y avoir une virgule ce premier argument et les arguments suivants. 
Sinon, il serait juste interprete comme tout autre un argument. 
Une situation tenebreuse dans laquelle ce message se produit est lorsque vous vous 
attendez a importer une constante dans votre espace de noms avec use ou import 
mais qu'une telle importation ne s'est pas produite. Vous auriez du utiliser une liste 
d'importation explicite des constantes que vous vous attendiez a voir. Une liste 
d'importation explicite aurait probablement intercepte cette erreur plus tot. Ou 
peut-etre s'agit-il seulement d'une erreur de frappe dans le nom de la constante. 

No command into which to pipe on command line 

(Pas de commande dans laquelle envoyer un pipe sur la ligne de commande) 
(F) II s'agit d'une erreur specifique a VMS. Perl effectue ses propres redirections 
dans la ligne de commande et a trouve un | a la fin de la ligne de commande, il ne 
sait done pas vers oil vous voulez rediriger avec un pipe la sortie de cette com- 
mande. 

No DB::DB routine defined 

(Pas de routine DB : : DB de definie) 

(F) Le code en train d'etre execute a ete compile avec l'option -d mais pour une rai- 
son ou pour une autre le fichier perl5db.pl (ou alors un fac-simile) n'a pas defini de 
routine a appeler au debut de chaque instruction. Ce qui est etrange car le fichier 
aurait du etre charge automatiquement et n'a pas pu etre analyse correctement. 

No dbm on this machine 

(Pas de dbm sur cette machine) 

(P) Ceci est compte comme une erreur interne ; chaque machine doit fournir dbm 
de nos jours car Perl est livre avec SDBM. 
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No DBsub routine 

(Pas de routine DBsub) 

(F) Le code en train de s'executer a ete compile avec Foption -d mais pour une rai- 
son ou pour une autre le fichier perl5db.pl (ou alors un fac-simile) n'a pas defini de 
routine DB: : sub a appeler au debut de chaque appel de sous-programme ordinaire. 

No error file after 2> or 2>> on command line 

(Pas de fichier d'erreur apres 2> ou 2>> sur la ligne de commande) 
(F) II s'agit d'une erreur specifique a VMS. Perl effectue ses propres redirections 
dans la ligne de commande et y a trouve un 2> ou un 2>> mais sans trouver le nom 
du fichier dans lequel ecrire les donnees destinees a STDERR. 

No input file after < on command line 

(Pas de fichier d'entree apres < sur la ligne de commande) 

(F) II s'agit d'une erreur specifique a VMS. Perl effectue ses propres redirections 
dans la ligne de commande et y a trouve un < mais sans trouver le nom du fichier 
depuis lequel lire les donnees de STDIN. 

No output file after > on command line 

(Pas de fichier de sortie apres 2> ou 2>> sur la ligne de commande) 
(F) II s'agit d'une erreur specifique a VMS. Perl effectue ses propres redirections 
dans la ligne de commande et a trouve un > isole a la fin de la ligne de commande 
mais sans savoir oil vous vouliez redirigez STDOUT. 

No output file after > or >> on command line 

(Pas de fichier de sortie apres > ou >> sur la ligne de commande) 
(F) II s'agit d'une erreur specifique a VMS. Perl effectue ses propres redirection 
dans la ligne de commande et y a trouve un > ou un >> mais sans trouver le nom du 
fichier dans lequel ecrire les donnees destinees a STDOUT. 

No package name allowed for variable %s in "our" 

(Pas de nom de paquetage autorise pour la variable %s dans "our") 
(F) Les noms de variable pleinement qualifies ne sont pas autorises dans les declara- 
tions our car cela n'aurait pas beaucoup de sens avec les semantiques existantes. 
Une telle syntaxe est reservee pour de futures extensions. 

No Perl script found in input 
(Pas de script Perl trouve en entree) 

(F) Vous avez appele perl -x mais aucune ligne n'est trouvee dans le fichier commen- 
cant par # ! et contenant le mot « perl ». 

No setregid available 

(Pas de setregid de disponible) 

(F) Configure n'a rien trouve qui ressemble a l'appel setregid pour votre systeme. 
No setreuid available 

(Pas de setreuid de disponible) 

(F) Configure n'a rien trouve qui ressemble a l'appel setreuid pour votre systeme. 
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No space allowed after -%c 

(Pas d'espace autorise apres -%c ) 

(F) L'argument de l'option de la ligne de commande indiquee doit suivre immedia- 
tement l'option, sans qu'aucun espace n'intervienne. 

No such pseudohash field "Is" 

(Aucun champ de pseudo-hachage "%s") 

(F) Vous avez essaye d'acceder a un tableau en tant que hachage mais le nom de 
champ utilise n'est pas defini. Le hachage a l'indice 0 doit faire correspondre tous 
les noms de champs valides aux indices du tableau pour que cela fonctionne. 

No such pseudohash field "%s" in variable %s of type %s 

(Aucun champ de pseudo-hachage "%s" dans la variable %s de type %s) 
(F) Vous avez essaye d'acceder a un champ d'une variable typee mais le type ignore 
le nom du champ. Les noms de champ sont recherches dans le hachage %FIELDS 
dans le paquetage du type a la compilation. Le hachage %FIELDS est generalement 
initialise avec le pragma fields. 

No such pipe open 
(Aucun pipe ouvert) 

(P) II s'agit d'une erreur specifique a VMS. La routine interne my_pclose a essaye de 
fermer un pipe qui n'avait pas ete ouvert. Ceci aurait du etre capture plus tot 
comme une tentative de fermeture d'un handle de fichier non ouvert. 

No such signal: SIC^s 

(Aucun signal: SIG^s) 

(W signal) Le nom de signal que vous avez specifie comme indice de %SIC n'a pas 
ete reconnu. Faites kill -I dans votre shell pour voir les noms de signaux valides sur 
votre systeme. 

No UTC offset information; assuming local time is UTC 

(Pas d'information sur le decalage UTC ; adopte UTC comme heure locale) 
(S) II s'agit d'un avertissement specifique a VMS. Perl a ete incapable de trouver le 
decalage horaire pour l'heure locale, il a done suppose que l'heure locale du sys- 
teme et UTC etaient equivalentes. SI ce n'est pas le cas, definissez le nom logique 
SYS$TIMEZONE_DIFFERENTIAL pour qu'il traduise le nombre de secondes a ajouter a 
UTC afin d'obtenir l'heure locale. 

Not a CODE reference 

(Non une reference de CODE) 

(F) Perl a essaye d'evaluer une reference vers une valeur de code (e'est-a-dire un 
sous-programme) mais a trouve une reference vers quelque chose d'autre a la place. 
Vous pouvez utiliser la fonction ref pour trouver de quelle sorte de reference il 
s'agissait exactement. 

Not a format reference 



(Non une reference de format) 

(F) Nous ne sommes pas surs de la maniere dont vous vous arrangez pour generer 
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une reference vers un format anonyme, mais ce message indique que vous l'avez 
fait et que cela n'existe pas. 

Not a GLOB reference 

(Non une reference de GLOB) 

(F) Perl a essaye d'evaluer une reference vers un « typeglob » (c'est-a-dire une 
entree dans la table des symboles ressemblant a *truc) mais a trouve une reference 
vers quelque chose d'autre a la place. Vous pouvez utiliser la fonction ref pour 
trouver de quelle sorte de reference il s'agissait exactement. 

Not a HASH reference 

(Non une reference de HACHAGE) 

(F) Perl a essaye d'evaluer une reference vers une valeur de hachage mais a trouve 
une reference vers quelque chose d'autre a la place. Vous pouvez utiliser la fonction 
ref pour trouver de quelle sorte de reference il s'agissait exactement. 

Not a perl script 

(Non un script perl) 

(F) L'emulateur setuid exige que le script possede une ligne valide de la forme #! 
meme sur les machines ne supportant pas la construction # ! . La ligne doit men- 
tionner « perl ». 

Not a SCALAR reference 

(Non une reference de SCALAIRE) 

(F) Perl a essaye d'evaluer une reference vers une valeur scalaire mais a trouve une 
reference vers quelque chose d'autre a la place. Vous pouvez utiliser la fonction ref 
pour trouver de quelle sorte de reference il s'agissait exactement. 

Not a subroutine reference 

(Non une reference de sous-programme) 

(F) Perl a essaye d'evaluer une reference vers une valeur de code (c'est-a-dire un 
sous-programme) mais a trouve une reference vers quelque chose d'autre a la place. 
Vous pouvez utiliser la fonction ref pour trouver de quelle sorte de reference il 
s'agissait exactement. 

Not a subroutine reference in overload table 

(Non une reference de sous-programme dans la table de surcharge) 

(F) Une tentative a ete faite pour specifier une entree dans une table de surcharge 

qui ne pointe pas d'une facon ou d'une autre vers un sous-programme valide. 

Not an ARRAY reference 

(Non une reference de TABLEAU) 

(F) Perl a essaye d'evaluer une reference vers une valeur de tableau mais a trouve 
une reference vers quelque chose d'autre a la place. Vous pouvez utiliser la fonction 
ref pour trouver de quelle sorte de reference il s'agissait exactement. 

Not enough arguments for %s 

(Pas assez d'arguments pour %s) 

(F) La fonction exige plus d'arguments que vous n'en avez specifies. 
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Not enough format arguments 

(Pas assez d'arguments de format) 

(W syntax) Un format specifiait plus de champs d'images que la ligne suivante ne 
lui en a fournis. 

Null filename used 

(Nom de fichier vide utilise) 

(F) Vous ne pouvez exiger un nom de fichier vide, notamment car sur beaucoup de 
machines ceci signifie le repertoire courant ! 

Null picture in formline 

(Image vide dans formline) 

(F) Le premier argument de formline doit etre une specification de format d'image 
valide. On a trouve que cet argument etait vide, ce qui signifie probablement que 
vous lui avez fourni une valeur non initialisee. 

NULL OP IN RUN 

(OP NUL DANS RUN) 

(P debugging) Une routine interne a appele run avec un pointer de code d'opera- 
tion (opcode) nul. 

Null realloc 

(reallocation nulle) 

(P) Une tentative a eu lieu pour reallouer le pointeur NULL. 

NULL regexp argument 

(argument NUL dans l'expression reguliere) 

(P) Les routines internes de recherche de motifs ont tout explose. 

NULL regexp parameter 

(parametre NUL dans l'expression reguliere) 

(P) Les routines internes de recherche de motifs ont perdu la tete. 

Number too long 

(Nombre trop long) 

(F) Perl limite la representation des nombres decimaux dans les programmes a 
environ 250 caracteres. Vous avez depasse cette longueur. Les futures versions de 
Perl sont susceptibles d'eliminer cette limitation arbitraire. En attendant, essayez 
d'utiliser la notation scientifique (ex. Ie6 au lieu de 1_000_000). 

Octal number > 037777777777 non portable 

(Nombre octal >037777777777, non portable) 

(W portable) Le nombre octal que vous avez specific est plus grand que 2**32-1 (4 
294 967 295) et n'est done pas portable d'un systeme a l'autre. 

Octal number in vector unsupported 

(Nombre octal dans un vecteur non supporte) 

(F) Les nombres commencant par un 0 ne sont actuellement pas autorises dans les 
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vecteurs. ^interpretation en octal de tels nombres sera peut-etre supportee dans 
une future version. 

Odd number of elements in hash assignment 

(Nombre impair d'element dans une affectation de hachage) 

(W misc) Vous avez specifie un nombre impair d'elements pour initialiser un 

hachage, ce qui est un impair a la regie car un hachage va avec des paires cle/valeur. 

Offset outside string 

(Decalage en dehors de la chame) 

(F) Vous avez essaye de faire une operation read/write/send/recv avec un decalage 
pointant en dehors du tampon. Ceci est difficile a imaginer. La seule exception a 
cette regie est que faire un sysread apres un tampon etendra ce tampon et remplira 
de zeros la nouvelle zone. 

oops: oopsAV 

(gloups : gloupsAV) 

(S internal) II s'agit d'un avertissement interne comme quoi la grammaire est abi- 
mee. 

oops: oopsHV 

(gloups gloupsHV) 

(S internal) II s'agit d'un avertissement interne indiquant que la grammaire est abi- 
mee. 

Operation "%s": no method found, %s 

(Operation "%s" : aucune methode trouvee, %s) 

(F) Une tentative a ete faite pour effectuer une operation de surcharge pour 
laquelle aucun gestionnaire n'a ete defini. Alors que certains gestionnaires peuvent 
etre autogeneres en termes d'autres gestionnaires, il n'existe pas de gestionnaire par 
defaut pour quelque operation que ce soit, a moins que la cle de surcharge fall- 
back soit specifiee comme etant vraie. 

Operator or semicolon missing before %s 

(Operateur ou point-virgule manquant avant %s) 

(S ambiguous) Vous avez utilise une variable ou un appel de sous-programme la ou 
l'analyseur syntaxique s'attendait a trouver un operateur. L'analyseur a considere 
que vous pensiez vraiment utiliser un operateur mais cela est fortement susceptible 
de s'averer incorrect. Par exemple, si vous ecrivez accidentellement *truc *truc, 
cela sera interprete comme si vous aviez ecrit *truc * 'truc J . 

Out of memory! 

(Depassement de memoire !) 

(X) La fonction interne de Perl malloc a renvoye 0, ce qui indique que la memoire 
restante (ou la memoire virtuelle) n'a pas suffit a satisfaire la requete. Perl n'a pas 
d'autre option que de sortir immediatement. 

Out of memory for yacc stack 

(Depassement de memoire pour la pile de yacc) 
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(F) L'analyseur syntaxique yacc a voulu agrandir sa pile pour qu'il puisse continuer 
son analyse mais realloc n'a pas voulu lui donner plus de memoire, virtuelle ou 
autre. 

Out of memory during request for %s 

(Depassement de memoire pendant une requete pour %s) 

(X|F) La fonction malloc a renvoye 0, ce qui indique que la memoire restante (ou la 
memoire virtuelle) n'a pas suffit a satisfaire la requete. 

La requete a ete jugee faible, la possibilite de la capturer est done dependante de la 
facon dont Perl a ete compile. Par defaut, elle ne peut etre capturee. Cependant, s'il 
a ete compile a cet effet, Perl peut utiliser le contenu de $ A M comme une zone 
d'urgence apres etre sorti par die avec ce message. Dans ce cas l'erreur peut-etre cap- 
turee une seule fois. 

Out of memory during "large" request for %s 

(Depassement de memoire pendant une requete "large" pour^s) 
(F) La fonction malloc a renvoye 0, ce qui indique que la memoire restante (ou la 
memoire virtuelle) n'a pas suffit a satisfaire la requete. Cependant, la requete a ete 
jugee assez large (par defaut 64K a la compilation), la possibilite de sortir en captu- 
rant cette erreur est done permise. 

Out of memory during ridiculously large request 

(Depassement de memoire pendant un requete ridiculement large) 
(F) Vous ne pouvez allouer plus de 2**31+« epsilon » octets. Cette erreur est gene- 
ralement causee par une faute de frappe dans le programme Perl (ex. $tab[time] 
au lieu de $tab[$time]). 

page overflow 

(depassement de page memoire) 

(W io) Un seul appel a write a produit plus de lignes que ne peut en contenir une 
page. 

panic: ck_grep 

(panique : ck_grep) 

(P) Le programme a echoue sur un test de coherence interne en essayant de compi- 
ler un grep. 

panic: ck_split 

(panique : ck_split) 

(P) Le programme a echoue sur un test de coherence interne en essayant de compi- 
ler un split. 

panic: corrupt saved stack index 

(panique : index de la pile de sauvegarde corrompu) 

(P) On a demande a la pile de sauvegarde de restaurer plus de valeurs localisees 
qu'il n'en existe. 

panic: del_backref 

(panique : reference arriere supprimee) 
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(P) Le programme a echoue sur un test de coherence interne en essayant de reini- 
tialiser une reference lache (weak reference). 

panic: die %s 

(panique : die %s) 

(P) Nous avons passe l'element du dessus de la pile de contexte a un contexte 
d'eval pour decouvrir alors que Ton n'etait pas dans un contexte d'eval. 

panic: dojnatch 

(panique : dojnatch) 

(P) La routine interne ppjnatch a ete appelee avec des donnees operationnelles 
invalides. 

panic: do_spl.it 

(panique : do_split) 

(P) Quelque chose de terrible s'est mal passe lors de la preparation pour un split, 
panic: do_subst 

(panique : do_subst) 

(P) La routine interne pp_subst a ete appelee avec des donnees operationnelles 
invalides. 

panic: dojtrans 

(panique : dojtrans) 

(P) La routine interne dojtrans a ete appelee avec des donnees operationnelles 
invalides. 

panic: frexp 

(panique : frexp) 

(P) La fonction de la bibliotheque frexp a echoue, rendant le printf ("%f ") impos- 
sible. 

panic: goto 

(panique : goto) 

(P) Nous avons passe l'element du dessus de la pile a un contexte avec l'etiquette 
specifiee et decouvert ensuite qu'il ne s'agissait pas d'un contexte que nous savions 
joindre par un goto. 

panic: INTERPCASEMOD 

(panique : INTERPCASEMOD) 

(P) L'analyseur lexical s'est retrouve dans un mauvais etat a un modificateur de 
casse (majuscule/minuscule). 

panic: INTERPCONCAT 

(panique : INTERPCONCAT) 

(P) L'analyseur lexical s'est retrouve dans un mauvais etat en analysant une chaine 
de caracteres avec des parentheses. 
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panic: kid popen errno read 

(panique : lecture du numero d'erreur dans le popen d'un fils) 

(F) Un fils issu d'un fork a renvoye un message incomprehensible a propose de son 

numero d'erreur. 

panic: last 

(panique : last) 

(P) Nous avons passe l'element du dessus de la pile a un contexte de bloc et decou- 
vert par la suite que ce n'etait pas un contexte de bloc. 

panic: leave_scope clearsv 

(panique : clearsv dans la sortie de la portee) 

(P) Une variable lexicale modifiable est maintenant en lecture seule dans le bloc 
pour une raison ou pour une autre. 

panic: leave_scope inconsistency 

(panique : sortie de la portee incoherente) 

(P) La pile de sauvegarde n'est surement plus synchronisee. Du moins, il y avait un 
type enum invalide a son sommet. 

panic: malloc 

(panique : malloc) 

(P) Quelque chose a demande un nombre negatif d'octets a malloc. 
panic: magic_killbackrefs 

(panique : suppression magique de toutes les references arrieres) 

(P) Le programme a echoue sur un test de coherence interne en essayant de reini- 

tialiser toutes les references laches vers un objet. 

panic: mapstart 

(panique : mapstart) 

(P) Le compilateur s'est embrouille avec la fonction map. 
panic: null array 

(panique : tableau nul) 

(P) On a passe a l'une des routines interne pour les tableaux un pointeur d'AV nul. 
panic: pad_alloc 

(panique : pad_alloc) 

(P) Le compilateur ne sait plus quelle memoire de travail (scratchpad) il allouait et 
liberait les valeurs temporaires et lexicales. 

panic: pad_free curpad 

(panique : pad_free curpad) 

(P) Le compilateur ne sait plus quelle memoire de travail (scratchpad) il allouait et 
liberait les valeurs temporaires et lexicales. 

panic: pad_free po 

(panique : pad_free po) 
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(P) Un decalage incorrect dans la memoire de travail (scratchpad) a ete detecte en 
interne. 

panic: pad_reset curpad 

(panique : pad_reset curpad) 

(P) Le compilateur ne sait plus quelle memoire de travail (scratchpad) il allouait et 
liberait les valeurs temporaires et lexicales. 

panic: pad_sv po 

(panique : pad_sv po) 

(P) Un decalage incorrect dans la memoire de travail (scratchpad) a ete detecte en 
interne. 

panic: pad_swipe curpad 

(panique : pad_swipe curpad) 

(P) Le compilateur ne sait plus quelle memoire de travail (scratchpad) il allouait et 
liberait les valeurs temporaires et lexicales. 

panic: pad_swipe po 

(panique : pad_swipe po) 

(P) Un decalage incorrect dans la memoire de travail (scratchpad) a ete detecte en 
interne. 

panic: pp_iter 

(panique : pp_iter) 

(P) L'iterateur de f oreach a ete appele dans un contexte qui n'etait pas un contexte 
de boucle. 

panic: realloc 

(panique : realloc) 

(P) Quelque chose a demande un nombre negatif d'octets a realloc. 
panic: restartop 
(panique restartop) 

(P) Une routine interne a demande un goto (ou quelque chose de semblable) mais 
n'a pas fourni de destination. 

panic: return 

(panique : return) 

(P) Nous avons passe l'element du dessus de la pile de contexte a un sous-pro- 
gramme ou a un contexte d'eval pour decouvrir alors que Ton n'etait ni dans un 
sous-programme, ni dans un contexte d'eval. 

panic: scan_num 

(panique : scanjium) 

(P) La fonction interne de Perl scan_num a ete appelee sur quelque chose qui n'etait 
pas un nombre. 
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panic: sv_insert 

(panique : sv_insert) 

(P) On a demande a la routine sv_insert d'enlever plus de chames qu'il en existe. 
panic: top_env 

(panique : top_env) 

(P) Le compilateur a tente de faire un goto ou quelque chose d'aussi bizarre, 
panic: yylex 

(panique : yylex) 

(P) L'analyseur lexical s'est retrouve dans un mauvais etat en traitant un modifica- 
teur de casse (majuscule/minuscule). 

panic: %s 

(panique : %s) 

(P) Une erreur interne. 
Parentheses missing around "%s" list 

(Parentheses manquantes autour de la liste "%s") 

(W parenthesis) Vous avez ecrit quelque chose comme : 
my $truc, $machin = |5)_; 

alors que vous vouliez dire : 
my ($truc, $machin) = @_; 

Souvenez-vous que my, our et local regroupent plus fortement que la virgule. 
Perl %3-3f required—this is only version %s, stopped 

(Perl %3 ■ 3f requis — il ne s'agit que de la version %s, arret) 

(F) Le module en question utilise des fonctionnalites offertes par une version plus 

recente que celle executee actuellement. Depuis combien de temps n'avez-vous pas 

fait de remise a niveau ? 

PERL_SH_DIR too long 
(PERL_SH_DIR trop long) 

(F) II s'agit d'une erreur specifique a OS/2. PERL_SH_DIR est le repertoire oil se 
trouve le shell sh. Voir PERL_SH_DIR dans le fichier README.os2 compris dans la dis- 
tribution de Perl. 

Permission denied 

(Permission refusee) 

(F) L'emulateur setuid de suidperl a decide que vous n'etiez pas quelqu'un de bon. 
pid %x not a child 

(le pid %x n'est pas un fils) 

(W exec) II s'agit d'une alerte specifique a VMS ; on a demande a waitpid d'atten- 
dre un processus qui n'est pas un sous-processus du processus courant. Meme si cela 
est correct dans la perspective de VMS, cela n'est probablement pas ce que vous 
vouliez. 



Chapitre 33 — Messages de diagnostic 



923 



POSIX getpgrp can't take an argument 
(get pgr p POSIX ne prend pas d'argument) 

(F) Votre systeme dispose de la fonction POSIX getpgrp, qui ne prend pas d'argu- 
ment, au contraire de la version BSD, qui prend un PID. 

Possible Y2K bug: %s 

(Bogue possible de l'an 2000) 

(W y2k) Vous etre en train de concatener le nombre 19 avec un autre nombre, ce 
qui pourrait etre un probleme potentiel pour l'an 2000. 

Possible attempt to put comments in qw() list 

(Tentative possible de mettre des commentaires dans une liste qw()) 
(W qw) Les listes qw contiennent des elements separes par des espacements ; comme 
avec les chaines litterales, les caracteres de commentaires ne sont pas ignores, mais 
au lieu de ca traites comme des donnees litterales. (Vous auriez pu utiliser des deli- 
miteurs differents des parentheses indiquees ici ; les accolades sont egalement fre- 
quemment utilisees.) 

Vous avez probablement ecrit quelque chose comme ceci : 
(Sliste = qw( 

a # un commentaire 

b # un autre commentaire 

); 

alors que vous auriez du ecrire cela : 

(Sliste = qw( 
a 
b 

); 

Si vous voulez vraiment des commentaires, construisez votre liste a l'ancienne, avec 
des apostrophes et des virgules : 
(fflliste = ( 

'a', # un commentaire 

'b' , # un autre commentaire 

); 

Possible attempt to separate words with commas 

(Tentative possible de separer les mots avec des virgules) 

(W qw) Les listes qw contiennent des elements separes par des espacements ; les vir- 
gules ne sont done pas necessaires pour separer les elements. (Vous auriez pu utili- 
ser des delimiteurs differents des parentheses indiquees ici ; les accolades sont 
egalement frequemment utilisees.) 
Vous avez probablement ecrit quelque chose comme ceci : 
qw( a, b, c ); 

ce qui place les caracteres virgules parmis certains elements de la liste. Ecrivez-le 
sans virgules si vous ne voulez pas les voir apparaitre dans vos donnees : 
qw( a b c ); 
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Possible memory corruption: %s overflowed 3rd argument 

(Corruption possible de la memoire : le 3 e argument de %s a deborde) 
(F) Un ioctl ou un f cntl a renvoye plus que ce Perl demandait. Perl anticipe un 
tampon de taille raisonnable mais place un octet de sentinelle a la fin du tampon 
au cas oil. On a ecrase cet octet de sentinelle et Perl suppose que la memoire est 
maintenant corrompue. 

pragma "attrs" is deprecated, use "sub NAME : ATTRS" instead 
(le pragma "attrs" est deprecie, utilisez a la place "sub NOM : ATTRS") 
(W deprecated) Vous avez ecrit quelque chose comme ceci : 
sub fait { 

use attrs qw(locked) 

} 

Vous auriez du utiliser a la place la nouvelle syntaxe de declaration : 
sub fait : locked 
{ 

Le pragma use attrs est maintenant obsolete et n'est fourni que pour assurer une 
compatibility anterieure. 

Precedence problem: open %s should be open(%s) 

(Probleme de precedence : open %s devrait etre open(^s)) 
(S precedence) L'ancienne construction irreguliere : 

open TRUC | | die; 
est maintenant mal interpreted en : 

open(TRUC | | die); 

a cause la stricte regularisation de la grammaire de Perl 5 en operateurs unaires et 
operateur de listes. (L'ancien open etait un peu des deux.) Vous devez mettre des 
parentheses autour du handle de fichier ou utiliser le nouvel operateur or a la 
place de | | . 

Premature end of script headers 

(Fin prematuree des en-tetes du script) 

Voir Server error. 
printQ on closed filehandle %s 

(print () sur le handle de fichier ferme %s) 

(W closed) Le handle de fichier dans lequel vous imprimez s'est retrouve ferme a 
un moment auparavant. Verifier le flux logique de votre programme. 

printf() on closed filehandle %s 

(printf () sur le handle de fichier ferme %s) 

(W closed) Le handle de fichier dans lequel vous ecrivez s'est retrouve ferme a un 
moment auparavant. Verifier le flux logique de votre programme. 

Process terminated by SIGXs 

(Processus termine par SIG^s) 
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(W) II s'agit d'un message standard formule par les applications OS/2, alors que les 
applications Unix meurent en silence. C'est considere comme une caracteristique 
du portage sous OS/2. Cet avertissement peut facilement etre desactive en position- 
nant les gestionnaires de signaux appropries. Voir egalement « Process terminated 
by SICTERM/SIGINT » (N.d.T. : Processus termine par SIGTERM/SICINT) dans le fichier 
README.os2 livre avec la distribution de Perl. 

Prototype mismatch: %s vs %s 

(Non correspondance de prototypes : %s contre %s) 

(S) La sous-fonction qui est en train d'etre declaree ou definie a ete precedemment 
declaree ou definie avec un prototype different. 

Range iterator outside integer range 

(Iterateur d'intervalle en dehors d'un intervalle) 

(F) L'un (ou les deux) des arguments numeriques de l'operateur d'intervalle . . est 
en dehors de l'intervalle qui peut etre represente en interne par des entiers. Con- 
tourner cela est en forcant Perl a utiliser des increments de chaines magiques en 
ajoutant 0 au debut de vos nombres. 

readlineQ on closed filehandle %s 

(readline() sur un handle de fichier ferme %s) 

(W closed) Le handle de fichier dans lequel vous etes en train de lire s'est retrouve 
ferme un moment auparavant. Verifier le flux logique de votre programme. 

realloc() of freed memory ignored 

(reallocQ sur de la memoire liberee, ignore) 

(S malloc) Une routine interne a appele realloc sur quelque chose qui avait deja 
ete libere. 

Reallocation too large: %lx 

(Reallocation trop grande : %lx) 

(F) Vous ne pouvez allouez plus de 64K sur une machine MS-DOS. 
Recompile perl with -DDEBUGGING to use -D switch 

(Recompilez Perl avec -DDEBUGGING pour utiliser l'option -D) 
(F debugging) Vous ne pouvez utiliser l'option -D que si Perl a ete compile avec le 
code qui produit la sortie desiree ; comme cela implique une certaine surcharge, 
cela n'a pas ete inclus dans votre instalaltion de Perl. 

Recursive inheritance detected in package '%s' 
(Heritage recursif detecte dans le paquetage '#s') 

(F) Plus de 100 niveaux d'heritage ont ete utilises. Ceci indique probablement une 
boucle accidentelle dans votre hierarchie de classes. 

Recursive inheritance detected while looking for method '%s' in package '%s' 
(Heritage recursif detecte en recherchant la methode '%s' dans le paquetage '#s') 
(F) Plus de 100 niveaux d'heritages ont ete utilises. Ceci indique probablement une 
boucle accidentelle dans votre hierarchie de classes. 
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Reference found where even-sized list expected 

(Reference trouvee ou une liste de taille paire etait attendue) 

(W misc) Vous avez donne une seule reference la ou Perl s'attendait a avoir une liste 

avec un nombre pair d'elements (pour affection a un hachage). Cela veut habituel- 

lement dire que vous avez utilise le constructeur de hachage anonyme alors que 

vous vouliez utiliser des parentheses. Dans tous les cas, un hachage exige des paires 

clef/valeur. 

%hachage = { un => 1, deux => 2, }; # MAUVAIS 

%hachage = [ qw( un tableau anonyme /)]; # MAUVAIS 
%hachage = ( un => 1, deux => 2, ); # juste 

%hachage = qw( un 1 deux 2 ); # egalement correct 

Reference is already weak 

(La reference est deja lache) 

(W misc) Vous avez tente de relacher une reference qui etait deja lache. Ceci n'a 
aucun effet. 

Reference miscount in sv_replace() 

(Mauvais compte de references dans sv_replace()) 

(W internal) On a passe a la fonction interne sv_replace un nouvel SV avec un 
nombre de references different de 1. 

regexp *+ operand could be empty 

(L'operande *+ de l'expression reguliere pourrait etre vide) 

(F) La partie d'une expression reguliere sujette au quantifiant * ou + pourrait cor- 
responds a une chaine vide. 

regexp memory corruption 

(Corruption de la memoire de l'expression reguliere) 

(P) Le moteur d'expressions regulieres s'est trompe avec ce que l'expression regu- 
liere lui a donne. 

regexp out of space 

(Plus d'espace pour l'expression reguliere) 

(P) II s'agit d'une erreur « qui ne peut pas arriver » car saf emalloc aurait du la cap- 
turer plus tot. 

Reversed %s= operator 

(Operateur#s= inverse) 

(W syntax) Vous avez ecrit votre operateur d'affectation a l'envers. Le = doit tou- 
jours arriver en dernier, pour eviter Fambiguite avec les operateurs unaires sui- 
vants. 

Runaway format 

(Format s'echappant) 

(F) Votre format contenait la sequence de repetition jusqu'a un caractere blanc — 
mais il a produit 200 lignes d'un coup et la 200 e ligne ressemblait exactement a la 
199eme. Apparemment vous ne vous etes pas arrange pour que les arguments soit 
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consommes, soit en utilisant A au lieu de @ (pour les variables scalaires), soit en fai- 
sant un shift ou un pop (pour les variables de tableaux). 

Scalar value @%s[%s] better written as $%s[%s] 

(Valeur scalaire <$%s [%s ] mieux ecrite avec $%s [%s ] ) 

(W syntax) Vous avez utilise une tranche de tableau (indique par @) pour selection- 
ner un seul element d'un tableau. Generalement il vaut mieux demander une 
valeur scalaire (indiquee par $). La difference est que $truc[&machin] se comporte 
toujours comme un scalaire, a la fois lors de son affectation et lors de 1'evaluation 
de son argument, alors que @truc[&machin] se comporte comme une liste lorsque 
vous y affectez quelque chose en fournissant un contexte de liste a son indice, ce qui 
peut donner des choses etranges si vous vous attendez a un seul indice. 
D'un autre cote, si vous esperiez vraiment traiter l'element du tableau comme une 
liste, vous devez regarder comment fonctionnent les references car Perl ne va pas 
par magie faire la conversion entre les scalaires et les listes a votre place. 

Scalar value %%s{%s] better written as %%s{%s] 
(Valeur scalaire @%s{%s} mieux ecrite avec %%s{%s}) 

(W syntax) Vous avez utilise une tranche de hachage (indiquee par @) pour selec- 
tionner un seul element d'un hachage. Generalement il vaut mieux demander une 
valeur scalaire (indiquee par $). La difference est que $truc{&machin} se comporte 
toujours comme un scalaire, a la fois lors de son affectation et lors de 1'evaluation 
de son argument, alors que @truc{&machin} se comporte comme une liste lorsque 
vous y affectez quelque chose en fournissant un contexte de liste a son indice, ce qui 
peut donner des choses etranges si vous vous attendez a un seul indice. 
D'un autre cote, si vous esperiez vraiment traiter l'element du hachage comme une 
liste, vous devez regarder comment fonctionnent les references car Perl ne va pas 
par magie faire la conversion entre les scalaires et les listes a votre place. 

Script is not setuid/setgid in suidperl 

(Le script n'est pas en setuid/setgid dans suidperl) 

(F) Curieusement, le programme suidperl a ete invoque sur un script qui n'a pas de 
bit setuid ou setgid bit positionne. Cela n'a vraiment aucun sens. 

Search pattern not terminated 

(Motif de recherche non termine) 

(F) L'analyseur lexical n'a pas pu trouver le delimiteur final d'une construction // 
ou m{}. Souvenez-vous que les delimiteurs fonctionnant par paires 
« ouvrant/fermant » (tels que les parentheses, les crochets, les accolades ou les 
signes inferieur/superieur) comptent les niveaux imbriques. Omettre le $ au debut 
d'une variable $m peut causer cette erreur. 

%sseek{) on unopened file 

(%sseek() sur un fichier non ouvert) 

(W unopened) Vous avez essaye d'utiliser la fonction seek ou sysseek sur un han- 
dle de fichier qui soit n'a jamais ete ouvert, soit a ete ferme depuis. 
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select not implemented 
(select non implemente) 

(F) Cette machine n'implemente pas l'appel systeme select. 
sem%s not implemented 
(sem%s non implemente) 

(F) Vous n'avez pas d'implementation des semaphores des IPC System V sur votre 
systeme. 

semi-panic: attempt to dup freed string 

(Demi-panique : tentative de dupliquer une chame liberee) 

(S internal) La routine interne newSVsv a ete appelee pour dupliquer un scalaire 
qui avait ete marque auparavant comme etant libre. 

Semicolon seems to be missing 

(II semble manquer un point-virgule) 

(W semicolon) Une quasi-erreur de syntaxe a probablement ete causee par un 
point-virgule manquant ou un autre operateur manquant peut-etre, comme une 
virgule. 

send() on closed socket 

(send ( ) sur une socket fermee) 

(W closed) La socket dans laquelle vous envoyer des donnees s'est retrouvee fermee 
a un moment auparavant. Verifiez le flux logique de votre programme. 

Sequence (? incomplete 

(Sequence ( ? incomplete) 

(F) Une expression reguliere finissait par une extension incomplete (?. 
Sequence (?#... not terminated 
(Sequence ( ? . . . non terminee) 

(F) Un commentaire d'une expression reguliere doit se terminer par une paren- 
these fermee. Les parentheses imbriquees ne sont pas autorisees. 

Sequence (7%s...) not implemented 

(Sequence ( ?%s . . . ) non implementee) 

(F) Une proposition d'extension des expressions regulieres a reserve le caractere 
mais n'a pas encore ete ecrite. 

Sequence (7%s...) not recognized 

(Sequence ( l%s . . . ) non reconnue) 

(F) Vous avez utilise une expression reguliere qui n'a aucun sens. 
Server error 

(Erreur du serveur) 

II s'agit du message d'erreur generalement vu dans une fenetre de navigateur lors- 
que vous essayez de lancer un programme CGI (y compris SSI) sur le Web. Le veri- 
table texte d'erreur varie largement d'un serveur a l'autre. Les variantes les plus 
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frequemment vues sont « 500 Server error », « Method (something) not 
permitted », « Document contains no data », « Premature end of script 
headers » et « Did not produce a valid header » (« Erreur de serveur 500 », 
« Methode (quelque_chose) non permise », « Le document ne contient aucune 
donnee », « Fin prematuree des en-tetes de script » et « N'a pas produit 
d'en-tete valide »). 

// s'agit d'une erreur CGI, non d'une erreur Perl. 

Vous devez vous assurer que votre script soit executable, accessible par Futilisateur 
sous lequel le script CGI tourne (qui n'est probablement pas le compte utilisateur 
sous lequel vous avez fait vos tests), qu'il ne repose sur aucune variable d'environ- 
nement (telle que PATH) que Futilisateur ne va pas avoir et qu'il ne se trouve pas a 
un emplacement inatteignables pour le serveur CGI. Pour plus d'informations, 
merci de voir les liens suivants : 

• http://www.perl. com/CPAN/doc/FA Qs/cgi/idiots-gu ide. h tm I 

• http://www.perl.com/CPAN/doc/FAQs/cgi/perl-cgi-faq.html 
' ftp://rtfm. mit. edu/pub/usenet/news. answers/www/cgi-faq 

' http://hoohoo.ncsa.uiuc.edu/cgi/interface.html 
' http://www-genome.wi.mit.edu/WWW/faqs/www-security-faq.htmI 
Vous devriez egalement regarder la FAQ Perl. 
setegid() not implemented 
(setegidQ non implemente) 

(F) Vous avez essaye d'affecter $) mais votre systeme d'exploitation ne supporte pas 
l'appel systeme setegid (ou un equivalent) ou du moins c'est ce que pense Confi- 
gure. 

seteuidQ not implemented 
(seteuidQ non implemente) 

(F) Vous avez essaye d'affecter $> mais votre systeme d'exploitation ne supporte pas 
l'appel systeme seteuid (ou un equivalent) ou du moins c'est ce que pense Confi- 
gure. 

setpgrp can't take arguments 

(setpgrp ne peut pas prendre d'arguments) 

(F) Votre systeme dispose de la fonction setpgrp de BSD 4.2, qui ne prend pas 
d'argument, au contraire de setpgid POSIX, qui prend un ID de processus et un ID 
de groupe de processus. 

setrgidQ not implemented 

(setrgidQ non implemente) 

(F) Vous avez essaye d'affecter $( mais votre systeme d'exploitation ne supporte pas 
l'appel systeme setrgid (ou un equivalent) ou du moins c'est ce que pense Confi- 
gure. 

setruidQ not implemented 
(setruidQ non implemente) 
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(F) Vous avez essaye d'affecter $< mais votre systeme d'exploitation ne supporte pas 
l'appel systeme setruid (ou un equivalent) ou du moins c'est ce que pense Confi- 
gure. 

setsockoptQ on closed socket %s 

(setsockoptQ sur une socket fermee %s) 

(W closed) Vous avez essaye de positionner des options sur une socket fermee. Peut- 
etre avez-vous oublie de verifier la valeur renvoyee par votre appel a socket ? 

Setuid/gid script is writable by world 

(Script setuid/setgid modifiable par le monde entier) 

(F) L'emulateur setuid ne lancera pas un script modifiable par le monde entier car 
le monde entier peut tres bien deja l'avoir modifie. 

shm%s not implemented 

(shmis non implemente) 

(F) Vous n'avez pas d'implementation de la memoire partagee des IPC System V 
sur votre systeme. 

shutdown () on closed socket %s 

(shutdown () sur une socket fermee %s) 

(W closed) Vous avez essaye de faire un shutdown sur socket fermee. Cela semble 
quelque peu superflu. 

SIGTs handler "%s" not defined 

(Gestionnaire "%s" pour SIG^s non defini) 

(W signal) Le gestionnaire pour le signal nomme dans %SIG n'existe en fait pas. 
Peut-etre Favez-vous mis dans le mauvais paquetage ? 

sort is now a reserved word 

(sort est maintenant un mot reserve) 

(F) II s'agit d'un ancien message d'erreur que pratiquement personne ne rencon- 
trera plus. Mais avant que sort soit un mot-clef, les gens l'utilisaient parfois comme 
un handle de fichier. 

Sort subroutine didn't return a numeric value 

(Le sous-programme de sort n'a pas renvoye de valeur numerique) 

(F) Une routine de comparaison pour sort doit retourner un nombre. Vous l'avez 

probablement foutu en Fair en n'utilisant pas <=> ou cmp, ou en ne les utilisant pas 

correctement. 

Sort subroutine didn't return single value 

(Le sous-programme de sort n'a pas renvoye une valeur unique) 

(F) Une routine de comparaison pour sort ne peut pas renvoyer une valeur de liste 

avec plus ou moins d'un element. 

Split loop 

(Boucle dans un split) 

(P) Le split bouclait sans fin. (Evidemment, un split ne devrait boucler plus de 
fois qu'il n'y a de caracteres en entree, ce qui s'est passe.) 
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Stat on unopened file <%s> 

(stat sur un fichier non ouvert <%s>) 

(W unopened) Vous avez essaye d'utiliser la fonction stat (ou un test de fichier 
equivalent) sur un handle de fichier qui n'a jamais ete ouvert ou qui a ete ferme 
depuis. 

Statement unlikely to be reached 

(Instruction peu susceptible d'etre atteinte) 

(W exec) Vous avez fait un exec avec des instructions le suivant autres qu'un die. II 
s'agit presque toujours d'une erreur car exec ne revient jamais a moins qu'il n'y ait 
une erreur. Vous vouliez probablement utiliser system a la place, qui lui revient. 
Pour supprimer cet avertissement, mettez le exec dans un bloc tout seul. 

Strange *+?{} on zero-length expression 

(*+?{} etrange sur une expression de longueur nulle) 

(W regexp) Vous avez applique un quantifiant d'expression reguliere a un endroit 
oil cela n'a aucun sens, comme dans une assertion de longueur nulle. Essayez de 
plutot mettre le quantifiant a Finterieur de Fassertion. Par exemple, le moyen de 
reussir la correspondance avec a be, si e'est suivi par trois repetitions de xyz est 
/abc(?=(?:xyz){3})/,etnon/abc(?=xyz){3}/. 

Stub found while resolving method '%s' overloading '%s' in package '%s' 

(Souche trouvee lors de la resolution de la methode 'Is' surchargeant '%s' dans le 
paquetage '%s') 

(P) La resolution de la surcharge dans Farbre @ISA a peut etre ete rompue par des 
souches (stubs) d'importation. Les souches ne devraient jamais etre implicitement 
creees mais les appels explicites a can peuvent rompre cela. 

Subroutine %s redefined 

(Sous-programme %s redefini) 

(W redefine) Vous avez redefini un sous-programme. Pour supprimer cet avertisse- 
ment, ecrivez : 

{ 

no warnings; 

eval "sub name { ... }"; 

} 

Substitution loop 

(Boucle dans une substitution) 

(P) La substitution boucle sans fin. (Evidemment, une substitution ne devrait bou- 
cler plus de fois qu'il n'y a de caracteres en entree, ce qui s'est passe.) 

Substitution pattern not terminated 

(Motif pour la substitution non termine) 

(F) L'analyseur lexical ne peut trouver le delimiteur interieur d'une construction 
si 1 1 ou s{}{}. Souvenez-vous que les delimiteurs fonctionnant par paires 
« ouvrant/fermant » (tels que les parentheses, les crochets, les accolades ou les 
signes inferieur/superieur) comptent les niveaux imbriques. Omettre le $ au debut 
d'une variable $s peut causer cette erreur. 
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Substitution replacement not terminated 

(Remplacement pour la substitution non termine) 

(F) L'analyseur lexical ne peut trouver le delimiteur final d'une construction s//7 
ou s{}{}. Souvenez-vous que les delimiteurs fonctionnant par paires 
« ouvrant/fermant » (tels que les parentheses, les crochets, les accolades ou les 
signes inferieur/superieur) comptent les niveaux imbriques. Omettre le $ au debut 
d'une variable $s peut causer cette erreur. 

substr outside of string 

(substr a l'exterieur d'une chaine) 

(W substr|F) Vous avez essaye de referencer un substr qui pointait en dehors d'une 
chaine. C'est-a-dire que la valeur absolue du decalage est plus grande que la lon- 
gueur de la chaine. Cet avertissement est fatal si substr est utilise dans un contexte 
de lvalue (par exemple comme operateur du cote gauche d'une affectation ou 
comme argument d'un sous-programme). 

suidperl is no longer needed since %s 

(suidperl n'est plus necessaire depuis %s) 

(F) Votre Perl a ete compile avec -DSETUID_SCRIPTS_ARE_SECURE_NOW mais une ver- 
sion de l'emulateur setuid est tout de meme arrive a se lancer d'une maniere ou 
d'une autre. 

switching effective %s is not implemented 

(l'echange de %s effectif n'est pas implemente) 

(F) Avec le pragma use f iletest actif, nous ne pouvons pas echanger les UID ou 
les GID reels et effectifs. 

syntax error 

(erreur de syntaxe) 

(F) Ce message veut probablement dire que vous avez eu une erreur de syntaxe. Les 
raisons habituelles incluent : 

• un mot clef est mal orthographie ; 

• il manque un point-virgule ; 

• il manque une virgule ; 

• il manque une parenthese ouvrante ou fermante ; 

• il manque un crochet ouvrant ou fermant ; 

• il manque une apostrophe ou un guillemet fermant. 

Souvent un autre message sera associe avec l'erreur de syntaxe donnant plus 
d'informations. (Parfois, cela aide d'activer -w.) Le message d'erreur en lui-meme 
dit souvent a quel endroit de la ligne Perl a decider de s'arreter. Parfois la veritable 
erreur se trouve quelque tokens avant car Perl est doue pour comprendre ce que 
l'on entre aleatoirement. Occasionnellement, le numero de ligne peut etre inexact 
et la seule maniere de savoir ce qui ce passe est d'appeler de facon repetitive, une 
fois tous les 36 du mois, perl -c en eliminant a chaque fois la moitie du programme 
pour voir ou l'erreur disparait. II s'agit d'une sorte de version cybernetique du jeu 
des 20 questions. 
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syntax error at line %d: '%s' unexpected 
(erreur de syntaxe a la ligne %d : '%s' inattendu) 

(A) Vous avez accidentellement lance votre script via le Bourne shell au lieu de 
Perl. Verifier la ligne # ! ou lancez vous-meme votre script manuellement dans Perl 
avec perl nom_script. 

System V %s is not implemented on this machine 

(%s de System V n'est pas implements sur cette machine) 

(F) Vous avez essaye de faire quelque chose avec une fonction commencant par sem, 
shm ou msg mais cet IPC System V n'est pas implemente sur votre machine. (Sur 
certaines machines, la fonctionnalite peut exister mais peut ne pas etre configuree.) 

syswriteQ on closed filehandle 

(syswriteQ sur un handle de fichier ferme) 

(W closed) Le handle de fichier dans lequel vous ecrivez s'est retrouve ferme a un 
moment auparavant. Verifiez le flux logique de votre programme. 

Target of goto is too deeply nested 

(La cible du goto est trop profondement imbriquee) 

(F) Vous avez essaye d'utiliser goto pour atteindre une etiquette qui etait trop pro- 
fondement imbriquee pour que Perl puisse Fatteindre. Perl vous fait une faveur en 
vous le refusant. 

tellQ on unopened file 

(tell( ) sur un fichier non ouvert) 

(W unopened) Vous avez essaye d'utiliser la fonction tellQ sur un handle de 
fichier qui n'a jamais ete ouvert ou qui a ete ferme depuis. 

Test on unopened file %s 

(Test sur un fichier non ouvert %s) 

(W unopened) Vous avez essaye d'invoquer un operateur de test de fichier sur un 
handle de fichier qui n'est pas ouvert. Verifiez votre logique. 

That use of $[ is unsupported 

(Cette utilisation de $[ n'est pas supportee) 

(F) L'affectation de $[ est maintenant strictement circonscrite et interpretee comme 
une directive de compilation. Vous devez maintenant ecrire une seule possibilite 
parmi celles-ci : 
$[ = 0; 

$[ = 1; 

local $[ = 0; 
local $[ = 1; 

Ceci est impose pour prevenir le probleme d'un module changeant la base des 
tableaux depuis un autre module par inadvertance. 
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The %s function is unimplemented 
(La fonction %s n'est pas implementee) 

La fonction indiquee n'est pas implementee sur cette architecture, selon les tests de 
Configure. 

The crypt() function is unimplemented due to excessive paranoia 

(La fonction crypt () n'est pas implementee a cause d'une paranoia excessive) 
(F) Configure n'a pas pu trouver la fonction crypt sur votre machine, probablement 
parce que votre vendeur ne Fa pas fournie, probablement parce qu'il pense que le 
gouvernement des Etats-Unis pense que c'est un secret ou du moins continue a pre- 
tendre que e'en est un. 

The stat preceding -1 _ wasn't an lstat 
(Le stat precedant -1 n'etait pas un lstat) 

(F) Cela n'a pas de sens de verifier si le tampon courant de stat est un lien symboli- 
que si le dernier stat que vous avez ecrit dans le tampon a deja passe le lien symbo- 
lique pour obtenir le fichier reel. Utilisez un veritable nom de fichier a la place. 

This Perl can't reset CRTL environ elements (%s) 

(Cette copie de Perl ne peut pas reinitialiser les elements de l'environnement de 
CRTL (%s)) 

This Perl can't set CRTL environ elements (%s = %s) 

(Cette copie de Perl ne peut pas positionner les elements de l'environnement de 
CRTL (%s =%s)) 

(W internal) II s'agit d'avertissements specifiques a VMS. Vous avez essaye de modi- 
fier ou de supprimer un element du tableau d'environnement interne de CRTL 
mais votre copie de Perl n'a pas ete compilee avec un CRTL contenant la fonction 
interne setenv. Vous devrez recompiler Perl avec un CRTL qui le contienne ou 
redefinir PERL_ENV_TABLES (voir perlvms(l)) pour que le tableau d'environnement 
ne soit pas la cible de la modification de %ENV qui a produit cet avertissement. 

times not implemented 

(times non implemente) 

(F) Votre version de la bibliotheque C ne fait apparemment pas de times. Je sus- 
pecte que vous n'etes pas sous Unix. 

Too few args to syscall 

(Trop peu d'arguments pour syscall) 

(F) II doit y avoir au moins un argument a syscall pour specifier l'appel systeme a 
appeler, pauvre etourdi ! 

Too late for "-T" option 

(Trop tard pour l'option "-T") 

(X) La ligne #! (ou son equivalent local) dans un script Perl contient l'option -T 
mais Perl n'a pas ete invoque avec -T sur la ligne de commande. II s'agit d'une 
erreur car le temps que Perl decouvre un -T dans un script, il est trop tard pour 
marquer proprement l'integralite de l'environnement. Done Perl abandonne. 
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Si le script Perl a ete execute en tant que commande en utilisant le mecanisme # ! 
(ou son equivalent local), cette erreur peut habituellement etre corrigee en editant 
la ligne # ! pour que l'option -T fasse partie du premier argument de Perl : ex. chan- 
ger perl -n -T en perl -T -n. 

Si le script Perl a ete execute en tant que perl nom_script alors l'option -T doit appa- 
raitre sur la ligne de commande : perl -T nom_script. 

Too late for "-%s" option 

(Trop tard pour l'option "-%s") 

(X) La ligne # ! (ou son equivalent local) dans un script Perl contient l'option -M ou 
-m. II s'agit d' une erreur car les options -M et -m ne sont pas prevues pour etre utili- 
ses a l'interieur des scripts. Utilisez use a la place. 

Too late to run %s bloc 

(Trop tard pour lancer le bloc %s) 

(W void) Un bloc CHECK ou INIT a ete defini a l'execution, lorsque l'opportunite de 
le lancer est deja passee. Vous chargez peut-etre un fichier avec require ou do alors 
que vous devriez utiliser use a la place. Ou vous devriez peut-etre mettre le require 
ou le do a l'interieur d'un bloc BEGIN. 

Too many ('s 

(Trop de « ( ») 
Too many )'s 
(trop de « ) ») 

(A) Vous avez lance accidentellement votre script via csh au lieu de Perl. Verifiez la 
ligne #! ou lancez vous-meme votre script manuellement dans Perl avec perl 
nom_script. 

Too many args to syscall 

(Trop d'argument pour syscall) 

(F) Perl supporte un maximum de 14 arguments seulement pour syscall. 
Too many arguments for %s 
(Trop d'argument pour %s) 

(F) La fonction demande moins d'arguments que vous en avez specifies, 
trailing \ in regexp 

(\ a la fin de l'expression reguliere) 

(F) L'expression reguliere se termine par un antislash qui n'est pas protege par un 
antislash. Faites-le. 

Transliteration pattern not terminated 

(Motif pour la traduction non termine) 

(F) L'analyseur lexical n'a pas pu trouver le delimiteur interieur d'une construction 
tr///, tr[] [], y/// ou y[] []. Omettre le $ au debut des variables $tr ou $y peut 
causer cette erreur. 
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Transliteration replacement not terminated 
(Remplacement pour la traduction non termine) 

(F) L'analyseur lexical n'a pas pu trouver le delimiteur final d'une construction 
tr///outr[][]. 

truncate not implemented 

(truncate non implemente) 

(F) Votre machine n'implemente pas de mecanisme de troncation de fichier que 
Configure puisse reconnaitre. 

Type of arg %d to %s must be %s (not %s) 

(Le type de l'argument %d de %s doit etre %s (pas %s)) 

(F) Cette fonction exige que l'argument a cette position soit d'un certain type. Les 
tableaux doivent etre @MOM ou @{EXP/?}. Les hachages doivent etre %NOM ou %{EXPR}. 
Aucun dereferencement implicite n'est permis — utilisez la forme {EXPR} en tant 
que dereferencement explicite. 

umask: argument is missing initial 0 

(umask : il manque 0 au debut de l'argument) 

(W umask) Un umask de 222 est incorrect. II devrait etre 0222 car les litteraux 
octaux commencent toujours par 0 en Perl, tout comme en C. 

umask not implemented 

(umask non implemente) 

(F) Votre machine n'implemente pas la fonction umask et vous avez essaye de l'utili- 
ser pour restreindre les permissions pour vous-meme. (EXPR & 0700). 

Unable to create sub named "%s" 

(Incapable de creer le sous-programme nomine "% ") 

(F) Vous avez tente de creer ou d'acceder a un sous-programme avec un nom illegal. 
Unbalanced context: %d more PUSHes than POPs 
(Contexte desequilibre : %d PUSH de plus que de POP) 

(W internal) Le code de sortie a detecte une incoherence interne entre le nombre 
de contextes d'execution dans lesquels on est entre et depuis lesquels on est sorti. 

Unbalanced saves: %d more saves than restores 

(Sauvegardes desequilibrees : %d sauvegardes de plus que de restaurations) 

(W internal) Le code de sortie a detecte une incoherence interne entre le nombre 

de variables qui ont ete sauvegardees par local. 

Unbalanced scopes: %d more ENTERs than LEAVEs 

(Portees desequilibrees : %d ENTER de plus que de LEAVE) 

(W internal) Le code de sortie a detecte une incoherence interne entre le nombre 
de blocs dans lequel on est rentre et depuis lesquels on est sorti. 

Unbalanced tmps: %d more allocs than frees 

(Valeurs temporaires desequilibres : %d allouees de plus que de liberees) 
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(W internal) Le code de sortie a detecte une incoherence interne entre le nombre 
de scalaires mortels qui ont ete alloues et liberes. 

Undefined format "%s" called 

(Format indefini "%s" appele) 

(F) Le format indique ne semble pas exister. Peut-etre est-il reellement dans un 
autre paquetage ? 

Undefined sort subroutine "%s" called 

(Sous-programme de sort indefini "%s" appele) 

(F) La routine de comparaison de sort specifiee ne semble pas exister. Peut-etre est- 
elle dans un autre paquetage? 

Undefined subroutine &%s called 

(Sous-programme indefini &%s appele) 

(F) Le sous-programme indique n'a pas ete defini ou s'il l'a ete, il a ete indefini 
depuis. 

Undefined subroutine called 

(Sous-programme indefini appele) 

(F) Le sous-programme anonyme que vous essayez d'appeler n'a pas ete defini ou 
s'il l'a ete, il a ete indefini depuis. 

Undefined subroutine in sort 

(Sous-programme indefini dans sort) 

(F) La routine de comparaison de sort specifiee est declaree mais ne semble pas 
avoir ete definie pour le moment. 

Undefined top format "%s" called 

(Format d'en-tete indefini "%s" appele) 

(F) Le format indique ne semble pas exister. Peut-etre est-il en realite dans un autre 
paquetage? 

Undefined value assigned to typeglob 

(Valeur indefinie affectee a un typeglob) 

(W misc) Une valeur indefinie a ete affectee a un typeglob, comme *truc = undef. 
Ceci n'a aucun effet. II est possible que vous vouliez dire en realite undef *truc. 

unexec of %s into %s failed! 

(Echec de l'unexec de %s dans %s !) 

(F) La routine unexec a echoue pour une raison ou pour une autre. Voir votre 
representant local FSF (Free Software Fondation), qui l'a probablement mis la en pre- 
mier lieu. 

Unknown BYTEORDER 

(BYTEORDER inconnu) 

(F) II n'y a aucune fonction d'echange d'octets pour une machine fonctionnant 
avec cet ordre d'octets. 
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Unknown open() mode '%s' 
(Mode d'openQ '%s' inconnu) 

(F) Le deuxieme argument d'un open a trois arguments n'est pas dans la liste des 
modes valides :<,>,> >, +<, +>, +> >, - 1 , | -. 

Unknown process %x sent message to prime_env_iter: %s 

(Le processus inconnu %x a envoye un message au prime_env_iter : %s) 
(P) II s'agit d'une erreur specifique a VMS. Perl lisait des valeurs pour %ENV avant de 
le parcourir et quelqu'un d'autre a colle un message dans le flux de donnees que 
Perl attendait. Quelqu'un de tres perturbe ou peut-etre essayant de subvertir le con- 
tenu de %ENV pour Perl dans un but nefaste. 

unmatched () in regexp 

(() sans correspondance dans l'expression reguliere) 

(F) Les parentheses non protegees par un anti-slash doivent toujours etre equili- 
brees dans les expressions regulieres. Si vous etes utilisateur de vi, la touche % est 
parfaitement adaptee pour trouver la parenthese correspondante. 

Unmatched right %s bracket 

(Signe %s fermant sans correspondance) 

(F) L'analyseur lexical a compte plus d'accolades ou de crochets fermants que 
d'ouvrants, vous avez done probablement oublie de mettre un signe ouvrant corres- 
pondant. En regie generale, vous trouverez le signe manquant (si Ton peut s'expri- 
mer ainsi) pres de l'endroit ou vous etiez en train d'editer en dernier. 

unmatched [] in regexp 

([] sans correspondance dans l'expression reguliere) 

(F) Les crochets autour d'une classe de caracteres doivent se correspondre. Si vous 
voulez inclure un crochet fermant dans une classe de caracteres, protegez le avec un 
antislash ou mettez le en premier. 

Unquoted string "%s" may clash with future reserved word 

(Chame sans guillemets ni apostrophes "%s" susceptible d'etre en conflit avec un 
mot reserve dans le futur) 

(W reserved) Vous utilisez un mot simple qui pourrait etre un jour proclame 
comme etant un mot reserve. Le mieux est de mettre un tel mot entre guillemets 
ou entre apostrophes ou en lettres capitales ou d'inserer un souligne dans son nom. 
Vous pouvez egalement le declarer en tant que sous-programme. 

Unrecognized character %s 

(Caractere %s non reconnu) 

(F) L'analyseur syntaxique de Perl ne sait absolument pas quoi faire avec le carac- 
tere specifie dans votre script Perl (ou dans un eval). Peut-etre avez-vous essaye de 
lancer un script compresse, un programme binaire ou un repertoire en tant que 
programme Perl. 

Unrecognized escape \\%c passed through 

(Rencontre d'une sequence d'echappement \\%c non reconnu) 
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(W misc) Vous avez employe une combinaison avec un caractere antislash qui n'est 
pas reconnue. 

Unrecognized signal name "%s" 

(Nom de signal "%s" non reconnu) 

(F) Vous avez specifie un nom de signal a la fonction kill qui n'est pas reconnue. 
Faites kill -1 dans votre shell pour voir les noms de signaux valides sur votre sys- 
teme. 

Unrecognized switch: -%s (-h will show valid options) 
(Option on reconnue : -%s (-h donne les options valides)) 

(F) Vous avez specifie une option illegale pour Perl. Ne faites pas cela. (Si vous pen- 
sez ne pas l'avoir fait, verifiez la ligne # ! pour voir si elle ne specifie pas la mauvaise 
option dans votre dos.) 

Unsuccessful %s on filename containing newline 

(Echec de %s sur un nom de fichier contenant un saut de ligne) 
(W newline) Une operation de fichier a ete tentee sur un nom de fichier et cette 
operation a echoue, probablement parce que le nom de fichier contenait un carac- 
tere de saut de ligne, probablement parce que vous avez oublie de le faire sauter par 
un chop ou un chomp. 

Unsupported directory function "%s" called 

(Fonction "%s" sur les repertoires non supportee appelee) 

(F) Votre machine ne supporte pas opendir et readdir. 
Unsupported function fork 

(Fonction fork non supportee) 

(F) Votre version d'executable ne supporte pas le fork. 

Remarquez que sur certains systemes, comme OS/2, il peut y avoir differentes ver- 
sions d'executables Perl, certaines d'entre elles supportent fork, d'autres non. 

Essayez de changer le nom que vous utilisez pour appelez Perl en perl_, perl et 

ainsi de suite. 

Unsupported function %s 

(Fonction %s non supportee) 

(F) Cette machine n'implemente apparemment pas la fonction indiquee ou du 
moins c'est ce que pense Configure. 

Unsupported socket function "%s" called 

(Fonction "%s" sur les sockets non supportee appelee) 

(F) Votre machine ne supporte pas le mecanisme des sockets Berkeley ou du moins 
c'est ce que pense Configure. 

Unterminated <> operator 

(Operateur < > non termine) 

(F) L'analyseur lexical a vu un signe inferieur a un endroit ou il s'attendait a un 
terme, il recherche done le signe superieur correspondant et ne le trouve pas. Il y a 
des chances que vous ayez oublie des parentheses obligatoires plus tot dans la 
meme ligne et vous que pensiez vraiment a un < signifiant « inferieur a ». 
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Unterminated attribute parameter in attribute list 
(Parametre d'attribut non termine dans une liste d'attributs) 
(F) L'analyseur lexical a vu une parenthese ouvrante lorsqu'il analysait une liste 
d'attributs mais n'a pas trouve la parenthese fermante correspondante. Vous devez 
ajouter (ou enlever) un caractere antislash pour equilibrer vos parentheses. 

Unterminated attribute list 
(Liste d'attributs non terminee) 

(F) L'analyseur lexical a trouve quelque chose d'autre qu'un identificateur simple 
au debut d'un attribut et ce n'etait pas un point-virgule ni le debut d'un bloc. Peut- 
etre avez-vous termine trop tot la liste de parametres de l'attribut precedent. 

Use of $# is deprecated 

(L'utilisation de $# est depreciee) 

(D deprecated) II s'agissait d'une tentative mal avisee d'emuler une fonctionnalite 
de awk mal definie. Utilisez plutot un printf ou sprintf explicite. 

Use of $* is deprecated 

(L'utilisation de $* est depreciee) 

(D deprecated) Cette variable activait comme par magie la recherche de motifs en 
multilignes, a la fois pour vous et pour les sous-programmes malchanceux que vous 
seriez amene a appeler. Maintenant, vous devriez utiliser les modificateurs //m et 
//s pour faire cela sans les effets dangereux d'action a distance de $*. 

Use of %s in printf format not supported 

(Utilisation de %s non supportee dans un format de printf) 

(F) Vous avez essaye d'utiliser une fonctionnalite de printf qui est accessible en C. 

Cela veut habituellement dire qu'il existe une meilleure maniere de faire cela en 

Perl. 

Use of bare << to mean <<"" is deprecated 

(L'utilisation d'un << brut signifiant <<"" est depreciee) 

(D deprecated) Vous etes maintenant encourage a utiliser la forme explicite avec 
des guillemets ou des apostrophes si vous desirez utiliser une ligne vide comme 
delimiteur final d'un document « ici-meme » (here document). 

Use of implicit split to @_ is deprecated 

(L'utilisation d'un split implicite sur @_ est depreciee) 

(D deprecated) Vous donnez beaucoup de travail au compilateur lorsque vous ecra- 
sez la liste d'arguments d'un sous-programme, il vaut done mieux affecter explicite- 
ment les resultats d'un split a un tableau (ou a une liste). 

Use of inherited AUTOLOAD for non-method %s() is deprecated 

(L'utilisation de l'heritage par AUTOLOAD pour la non-methode %s ( ) est depreciee) 
(D deprecated) Comme fonctionnalite (hum) accidentelle, les sous-programmes 
AUTOLOAD etaient recherches de la mime facon que les methodes (en utilisant la 
hierarchie de @ISA) mime lorsque les sous-programmes a autocharger etaient appe- 
les en tant que fonctions brutes (ex. : True : : biduleQ) et pas en tant que methodes 
(parexemple, Truc->bidule() ou $obj->bidule()). 
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Ce bogue a ete rectifie dans Perl 5.005, qui utilisait la recherche de methodes settle- 
ment pour l'AUTOLOAD de methodes. Cependant, il y a une base significative de code 
existant susceptible d'utiliser l'ancien comportement. Ainsi, en tant qu'etape inter- 
mediate, Perl 5.004 emettait cet avertissement optionnel quand des non-methodes 
utilisaient des AUTOLOAD heritees. 

La regie simple est la suivante : l'heritage ne fonctionnera pas quand il y a auto- 
chargement de non-methodes. La simple correction pour de l'ancien code est : dans 
tout module qui avait l'habitude de dependre de l'heritage d'AUTOLOAD pour les 
non-methodes d'une classe de base nommee Classe_Base, executez *AUT0L0AD = 
&Classe_Base: : AUTOLOAD au demarrage. 

Dans le code qui actuellement fait use AutoLoader; @ISA = qw(AutoLoader);, 
vous pouvez supprimer AutoLoader de @ISA et changer use AutoLoader; en use 
AutoLoader 'AUTOLOAD';. 

Use of reserved word "%s" is deprecated 

(L'utilisation du mot reserve "%s" est depreciee) 

(D deprecated) Le mot simple indique est un mot reserve. Les futures versions de 
Perl peuvent l'utiliser en tant que mot-clef, vous feriez done mieux de mettre expli- 
citement le mot entre guillemets ou entre apostrophes d'une maniere appropriee a 
son contexte d'utilisation ou d'utiliser de surcroit un nom different. L'avertisse- 
ment peut etre supprime pour les noms de sous-programmes en ajoutant un pre- 
fixe & ou en qualifiant la variable avec le paquetage, comme &local(), ou 
True: :local(). 

Use of %s is deprecated 

(L'utilisation de %s est depreciee) 

(D deprecated) La construction indiquee n'est plus recommandee, generalement 
parce qu'il y a une meilleure facon de faire et egalement parce que l'ancienne 
methode a de mauvais effets de bord. 

Use of uninitialized value %s 

(Utilisation d'une valeur non initialised %s) 

(W uninitialized) Une valeur indefinie a ete utilisee comme si elle avait deja ete 
definie. Elle a ete interpretee comme un "" ou un 0 mais peut-etre est-ce une 
erreur. Pour supprimer cet avertissement, affectez une valeur definie a vos varia- 
bles. 

Useless use of "re" pragma 

(Utilisation inutile du pragma "re") 

(W) Vous avez fait un use re sans aucun argument. Ceci n'est vraiment pas tres 
utile. 

Useless use of %s in void context 

(Utilisation inutile de %s dans un contexte vide) 

(W void) Vous avez fait quelque chose sans effet de bord dans un contexte qui ne 
fait rien de la valeur de retour, comme une instruction ne renvoyant pas de valeur 
depuis un bloc ou le cote gauche d'un operateur scalaire virgule. Par exemple, vous 
obtiendrez ceci si vous confondez les precedences en C avec les precedences en 
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Python en ecrivant : 

$un, $deux = 1, 2; 
alors que vous vouliez dire : 

($un, $deux) = (l, 2); 
Une autre erreur courante est l'utilisation de parentheses ordinaires pour cons- 
truire une liste de references alors vous devriez utiliser des accolades ou des cro- 
chets, par exemple, si vous ecrivez : 

$tableau = (1,2); 
alors que vous vouliez dire : 

$tableau = [1,2]; 

Les crochets transforment explicitement une valeur de liste en une valeur scalaire 
tandis que les parentheses ne le font pas. Done, lorsqu'une liste entre parentheses 
est evaluee dans un contexte scalaire, la virgule est traitee comme Foperateur vir- 
gule du C, qui rejette l'argument de gauche, ce qui n'est pas ce que vous voulez. 

untie attempted while %d inner references still exist 

(untie tente alors que %d references interieures existent toujours) 

(W untie) Une copie de l'objet renvoye par tie (ou par tied) etait toujours valide 

lorsqu'untie a ete appele. 

Value of %s can be "0"; test with definedQ 

(La valeur de %s peut valoir "0" ; testez avec defined ()) 

(W misc) Dans une expression conditionnelle, vous avez utilise <HANDLE>, <*> 
(glob), each ou readdir en tant que valeur booleenne. Chacune de ces construc- 
tions peut renvoyer une valeur de "0" ; cela rendrait fausse l'expression condition- 
nelle, ce qui n'est probablement pas ce que vous desiriez. Quand vous utilisez ces 
constructions dans des expressions conditionnelles, testez leur valeur avec l'opera- 
teur defined. 

Value of CLI symbol "Is" too long 

(Valeur du symbole de CLI "%s" trop longue) 

(W misc) II s'agit d'un avertissement specifique a VMS. Perl a essaye de lire la 
valeur d'un element de %ENV depuis la table de symboles de CLI et a trouve une 
chaine resultante plus longue que 1 024 caracteres. La valeur de retour a ete tron- 
quee a 1 024 caracteres. 

Variable "%s" is not imported %s 

(La variable "%s" n'est pas importee de %s) 

(F) Alors que use strict est active, vous vous etes referes a une variable globale 
qu'apparemment vous pensiez avoir importee depuis un autre module car quelque 
chose d'autre ayant le meme nom (habituellement un sous-programme) est 
exporte par ce module. Cela veut habituellement dire que vous vous etes trompe 
de drole de caractere ($, @, % ou &) devant votre variable. 

Variable "%s" may be unavailable 

(La variable "%s" peut etre inaccessible) 

(W closure) Un sous-programme anonyme interieur (imbrique) se trouve dans un 
sous-programme nomme et encore a l'exterieur se trouve un autre sous-programme ; 
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et le sous-programme anonyme (le plus a l'interieur) fait reference a une variable 
lexicale definie dans le sous-programme le plus a l'exterieur. Par exemple : 

sub le_plus_exterieur { my $a; sub aujnilieu { sub { $a } } } 
Si le sous-programme anonyme est appele ou reference (directement ou indirecte- 
ment) depuis le sous-programme le plus a l'exterieur, il va partager la variable 
comme vous pouviez vous y attendre. Mais si le sous-programme anonyme est 
appele ou reference lorsque le sous-programme le plus a l'exterieur est inactif il 
verra la valeur de la variable partagee telle qu'elle etait avant et pendant le premier 
appel au sous-programme le plus a l'exterieur, ce qui n'est probablement pas ce que 
vous voulez. 

Dans ces circonstances, il vaut habituellement mieux rendre anonyme le sous-pro- 
gramme du milieu anonyme, en utilisant la syntaxe sub {}. Perl possede un sup- 
port specifique pour les variables partagees dans les sous-programmes anonymes 
imbriques ; un sous-programme nomme entre les deux interfere avec cette fonc- 
tionnalite. 

Variable "%s" will not stay shared 

(La variable "%s" ne restera pas partagee) 

(W closure) Un sous-programme nomme interieur (imbrique) fait reference a une 
variable lexicale definie dans un sous-programme exterieur. 

Lorsque le sous-programme interieur est appele, il verra probablement la valeur de 
la variable du sous-programme exterieur telle qu'elle etait avant et pendant le pre- 
mier appel au sous-programme exterieur ; dans ce cas, apres que le premier appel au 
sous-programme exterieur est termine, les sous-programmes interieur et exterieur 
ne partageront plus de valeur commune pour la variable. En d'autres termes, la 
variable ne sera plus partagee. 

De plus, si le sous-programme exterieur est anonyme et fait reference a une varia- 
ble lexicale en dehors de lui-meme, alors les sous-programmes interieur et exterieur 
ne partageront jamais la variable donnee. 

Le probleme peut habituellement etre resolu en rendant anonyme le sous-pro- 
gramme interieur, en utilisant la syntaxe sub {}. Lorsque des sous-programmes 
anonymes interieurs, faisant reference a des variables dans des sous-programmes 
exterieurs, sont appeles ou references, ils sont automatiquement relies a la valeur 
courante de ces variables. 

Variable syntax 

(Syntaxe de variable) 

(A) Vous avez lance accidentellement votre script via csh au lieu de Perl. Verifiez la 
ligne #! ou lancez vous-meme votre script manuellement dans Perl avec perl 
nom_script. 

Version number must be a constant number 

(Le numero de version doit etre un nombre constant) 

(P) La tentative de conversion d'une instruction use Module n.n LISTE vers le bloc 
BEGIN equivalent a trouve une incoherence interne dans le numero de version. 

perl: warning: Setting locale failed. 

(perl : avertissement : Echec avec la configuration des locales) 
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(S) Le message divertissement complet ressemblera quelque peu a : 
perl: warning: Setting locale failed. 

perl: warning: Please check that your locale settings: 
LC_ALL = "FrFR", 
LANG = (unset) 
are supported and installed on your system, 
perl: warning: Falling back to the standard locale ("C"). 1 
(La configuration des locales qui a echoue variera.) Cette erreur indique que Perl a 
detecte que vous ou votre administrateur systeme avez configure les variables du 
systeme ainsi nominees mais Perl n'a pas pu utiliser cette configuration. Ce n'est pas 
mortel, heureusement : il existe une locale par defaut appelee « C » que Perl peut 
et va utiliser pour le script puisse ainsi fonctionner. Mais avant que vous resolviez 
vraiment ce probleme, vous allez toutefois avoir le meme message d'erreur a cha- 
que fois que vous lancerez Perl. La maniere de vraiment resoudre le probleme peut 
etre trouvee dans perUocale(l), a la section « Locale Problems ». 

Warning: something's wrong 

(Avertissement : quelque chose s'est mal passe) 

(W) Vous avez passe a warn une chaine vide (l'equivalent d'un warn "") ou vous 
l'avez appele sans arguments et $_ etait vide. 

Warning: unable to close filehandle %s properly 

(Avertissement : incapable de fermer proprement le handle de fichier %s) 
(S) Le close implicite effectue par un open a recu une indication d'erreur sur le 
close. Cela indique habituellement que votre systeme de fichier a epuise l'espace 
disque disponible. 

Warning: Use of "%s" without parentheses is ambiguous 

(Avertissement : Lutilisation de "%s" sans parentheses est ambigue) 
(S ambiguous) Vous avez ecrit un operateur unaire suivi par quelque chose ressem- 
blant a un operateur binaire mais pouvant egalement etre interprete comme un 
terme ou un operateur unaire. Par exemple, si vous savez que la fonction rand a un 
argument par defaut valant 1 . 0 et que vous ecrivez : 
rand + 5; 

vous pouvez pensez que vous avez ecrit la meme chose que : 

rand() + 5; 
alors qu'en fait vous avez obtenu : 

rand(+5); 



1. N.d.T.: 

perl : avertissement : Echec avec la configuration des locales. 

perl : avertissement : Merci de verifier que votre configuration 
des locales : 
LC_ALL = "Fr_FR", 
LANG = (non configure) 
soit supportee et installee sur votre systeme. 
perl : avertissement : Retour aux locales standards ("C"). 



Chapitre 33 — Messages de diagnostic 
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Done mettez des parentheses pour dire ce que vous voulez vraiment dire. 
writeQ on closed filehandle 

(write ( ) sur un handle de fichier ferme) 

(W closed) Le handle de fichier dans lequel vous ecrivez s'est retrouve ferme un 
moment auparavant. Verifiez le flux logique de votre programme. 

X outside of string 

(X en dehors d'une chaine) 

(F) Vous aviez un canevas pour pack specifiant une position relative avant le debut 
de la chame en train d'etre depaquete. 

x outside of string 

(x en dehors d'une chaine) 

(F) Vous aviez un canevas pour pack specifiant une position relative apres la fin de 
la chaine en train d'etre depaquete. 

Xsub "%s" called in sort 

(Xsub "%s" appele dans un sort) 

(F) L'utilisation d'un sous-programme externe pour la comparaison d'un sort n'est 
pas encore supportee. 

Xsub called in sort 

(Xsub "%s" appele dans un sort) 

(F) L'utilisation d'un sous-programme externe pour la comparaison d'un sort n'est 
pas encore supportee. 

You can't use -1 on a filehandle 

(Vous ne pouvez pas utiliser -1 sur un handle de fichier) 

(F) Un handle de fichier represente un fichier ouvert et lorsque vous avez ouvert le 
fichier, il avait deja passe tous les liens symboliques que vous essayez vraisemblable- 
ment de rechercher. Utilisez plutot un nom de fichier. 

YOU HAVEN'T DISABLED SET-ID SCRIPTS IN THE KERNEL YET! 

(VOUS N'AVEZ TOUJOURS PAS DESACTIVE LES SCRIPTS SET-ID DANS LE 
NOYAU !) 

(F) Et vous ne le ferez probablement jamais car vous n'avez pas les sources du noyau 
et probablement que votre fabriquant se moque eperdument de ce que vous vou- 
lez. La meilleure solution est de mettre une surcouche setuid en C autour de votre 
script en utilisant le script wrapsuid situe dans le repertoire eg de la distribution 
Perl. 

You need to quote "%s" 

(Vous devez proteger "%s" avec des guillemets ou des apostrophes) 
(W syntax) Vous avez affecte un mot simple comme nom d'un gestionnaire de 
signaux. Malheureusement, vous avez deja un sous-programme avec ce nom, ce qui 
veut dire que Perl 5 essayera d'appeler ce sous-programme lorsque l'affectation sera 
executee, ce qui n'est probablement pas ce que vous voulez. (Si e'est bien ce que vous 
voulez, mettez une & devant.) 
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Un mot reference ailleurs dans le glossaire 
est presente en italique a la maniere d'un hy- 
perlien. 

addresse reseau 

L'attribut le plus important d'une socket, 
comme le numero de votre telephone. 
Typiquement une adresse IE Voir aussi 
port. 

affectation 

Un operateur dont la fonction est de modi- 
fier la valeur d'une variable. 

algorithme 

Sequence d' instructions clairement defi- 
nie dans le langage de la machine (vir- 
tuelle). 

alias 

Surnom d'une variable qui se comporte 
comme le nom original. Par exemple, un 
alias temporaire est cree implicitement 
pour la variable de boucle dans ['instruc- 
tion foreach, avec les operateurs map et 
grep dans la variable $_, dans les variables 
$a et $b lors de l'appel de la fonction de 
comparaison sort ou bien pour les para- 
metres reek d'un appel de fonction dans la 
variable @_. Des alias permanents sont 
crees explicitement dans les paquetages par 
{'importation des symboles ou par affecta- 
tion dans les typeglobs. Des alias a portee 
lexicale dans les paquetages sont crees avec 
la declaration our. 



alternatives 

Une liste de choix possibles parmi lesquels 
on ne peut en selectionner qu'un, comme 
dans : « Preferez-vous la porte A, B ou 
C ? » Les termes des alternatives dans les 
expressions regulieres sont separes par une 
barre verticale : | . Les termes des alternati- 
ves dans les expressions Perl normales sont 
separes par deux barres verticales : | | . On 
peut parler d'une alternative d'alternatives. 
Ou non. A vous de choisir. Les alternatives 
logiques dans les expressions booleennes 
sont separees par | | ou bien or. 

analyse lexicale 

Terme amusant pour dire tokeniseur. 

analyse syntaxique 

L'art subtil et parfois brutal pour tenter de 
tranformer votre programme avec ses 
erreurs potentielles en arbre syntaxique. 

anonyme 

Qualifie un referent qui ne peut etre 
accede par une variable, mais indirecte- 
ment par une reference dure, qui disparait 
apres utilisation. 

appel par reference 

Un mecanisme de passage d'arguments par 
lequel les arguments formels se referent 
directement aux arguments reels, le sous- 
programme pouvant modifier les argu- 
ments reels en changeant les arguments 
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formels. Les arguments formels sont des 
alias pour les arguments reels. Voir aussi 
appel par valeur. 

appel par valeur 

Un mecanisme de passage d'arguments par 
lequel les arguments formels se referent a 
une copie des arguments reels, le sous-pro- 
gramme ne pouvant modifier les argu- 
ments reels par les arguments formels. 
Voir aussi appel par reference. 

appel systeme 

Un appel direct de sous-programme au sys- 
teme d'exploitation. Nombre des fonctions 
et des sous-programmes utilises ne sont 
pas des appels systemes directs, mais cons- 
tituent des surcouches au-dessus du niveau 
de l'appel systeme. En general, les utilisa- 
teurs de Perl n'ont pas a se soucier de la 
distinction. Neanmoins, si vous connaissez 
les fonctions Perl qui font des appels syste- 
mes, vous savez celles qui affecteront la 
variable $! ($ERRN0) lors d'un echec. Mal- 
heureusement, les programmeurs Perl 
emploient souvent le terme « appel 
systeme » lorsqu'ils utilisent la fonction 
system, laquelle met en jeu beaucoup 
d'appels systemes. Pour eviter tout confu- 
sion, nous utilisons presque toujours le 
terme « appel systeme » pour designer 
l'appel indirect a l'aide de la fonction Perl 
syscall, mais jamais pour indiquer un 
appel de la fonction Perl system. 

appelant 

L'agent responsable de l'appel d'une 
methode. Dans une methode de classe, 
l'appelant est un nom de paquetage. Dans 
une methode d'instance l'appelant est une 
reference d'objet. 

approche bofte a outils 

La notion selon laquelle, avec un ensem- 
ble complet d'outils simples qui fonction- 
nent bien les uns avec les autres, il est 
possible de realiser ce que Ton veut. Ce qui 
convient si Ton assemble un tricycle, mais 
dans le cas d'un microstheseur rhombo'i- 
dal a double inversion de flux, il faut abso- 
lument qu'un atelier construise les outils 
adaptes. Perl est une sorte d'atelier. 



arbre d'analyse 

Voir arbre syntaxique. 

arbre syntaxique 

Une representation interne de votre pro- 
gramme dans laquelle les constructions de 
bas-niveau sont incluses dans les blocs 
contenant. 

architecture 

Le type d'ordinateur sur lequel on tra- 
vaille, « type » signifiant que les ordina- 
teurs en faisant partie peuvent faire 
tourner le meme programme binaire. Puis- 
que les scripts Perl sont des fichiers texte et 
non binaires, un script Perl est beaucoup 
moins sensible a l'architecture sur laquelle 
il tourne que les programmes d'autres lan- 
gages (comme C) qui sont compiles en 
code machine. Voir aussi systeme d'exploita- 
tion. 

argument 

Des donnees fournies en entree d'un pro- 
gramme, d'un sous-programme, d'une fonc- 
tion ou d'une methode servant a lui dire 
quoi faire. Egalement appele « parame- 
tre ». 

arguments de la ligne de commande 

Les valeurs fournies comme parametres 
d'un programme dont l'execution est 
demandee au shell. Ces valeurs sont acces- 
sibles en Perl par l'intermediaire du 
tableau @ARCV 

arguments formels 

Nom generique des arguments d'un sous- 
programme. En Perl, les arguments formels 
d'un programme sont dans un tableau : 
$ARGV[0], $ARGV[1], ainsi de suite. Ceux 
d'un sous-programme sont $_[o], $_[l], 
etc, arguments qu'on peut tranformer 
localement en noms par l'affectation a une 
liste my. Voir aussi arguments reels. 

arguments reels 

Les valeurs scalaires que Ton fournit a une 
fonction ou a un sous-programme que Ton 
appelle. Par exemple, quand on appelle 
jeton("bingo"), la chaine "bingo" est 
l'argument reel. Voir egalement argument 
et arguments formels. 
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ARGV 

Nom du tableau qui contient le vecteur 
d'argument de la ligne de commande. Avec 
l'operateur <>, ARGV est a la fois le nom du 
filehandle qui utilisera les arguments et le 
scalaire contenant le nom du fichier en 
entree. 

ASCII 

« American Standard Code for Informa- 
tion Interchange » (un ensemble de carac- 
tere efficace pour la representation 
imparfaite des textes anglais). Utilise aussi 
pour designer les 128 premieres valeurs 
des codages ISO-8859-X, un groupe de 
codes 8 bits incompatibles entre eux. 

assertion 

Composant d'une expression reguliere qui 
doit etre vraie pour le motif recherche, 
mais qui ne correspond pas forcement 
avec un caractere. Souvent utilise pour 
designer une assertion de longueur nulle, 
c'est-a-dire evaluee sur une chaine nulle. 

associativite 

Determine lequel des operateurs de droite 
ou de gauche est execute en premier, 
quand on a « A operateur B operateur C » , 
si les deux operateurs ont la meme prece- 
dence. Les operateurs comme + sont asso- 
ciatifs a gauche, alors que les operateurs 
comme ** sont associatifs a droite. Le cha- 
pitre 3, Operateurs unaires et binaires, 
donne la liste des associativites. 

asynchrone 

Evenements ou activites dont l'occurrence 
relative est indeterminee, car trop nom- 
breux a se produire dans la meme unite 
temporelle. On peut dire que c'est un eve- 
nement qui arrivera a l'improviste. 

atome 

Composant d'une expression reguliere qui 
peut correspondre a une sous-chaine qui 
contient un ou plusieurs caracteres et qui 
est traitee comme une unite syntaxique 
par tout quantificateur qui la suit. A com- 
parer avec Yassertion qui s'evalue sur une 
chaine de longueur nulle et ne peut etre 
quantified. 



attribut 

Nouvelle fonctionnalite qui permet 
d'ajouter des modificateurs a des declara- 
tions de variable ou fonction avec modifica- 
teurs comme dans sub foo : locked 
method. C'est aussi l'autre nom d'une 
variable d'instance d'un objet. 

autogeneration 

Fonctionnalite de ['operateur de surcharge 
des objets, ou le comportement de certains 
operateurs peut etre derive des operateurs 
fondamentaux. Cela suppose bien 
entendu que les operateurs surcharges ont 
les memes relations que les operateurs 
ordinaires. Voir le chapitre 13, Surcharge. 

auto-incrementation 

Ajouter automatiquement un a quelque 
chose. Generalement employe pour 
decrire l'operateur ++. L'operation inverse, 
soustraire 1, est appele « autodecremen- 
tation ». 

autochargement 

Chargement a la demande (egalement 
appele « chargement paresseux »), precise- 
ment appel d'une fonction AUTOLOAD en 
lieu et place d'un routine indefmie. 

autosplit 

Decoupage automatique d'une chaine a la 
maniere du selecteur -a utilise avec -p ou - 
n pour emuler la commande awk. Voir 
aussi le module AutoSplit (qui n'a rien a 
voir avec l'autosplit, mais beaucoup a voir 
avec l'autochargement). 

autovivification 

Terme d'origine greco-latine signifiant lite- 
ralement « se donner la vie ». En Perl, les 
places memoires (ou lvalues) se creent sui- 
vant le besoin, y compris la creation des 
references dures necessaires pour adresser le 
niveau suivant de stockage. L'affectation 
$a[5][5][5][5][5] = "quintet" cree 
cinq scalaires, plus quatre references (dans 
les quatre premiers scalaires) pointant sur 
quatre tableaux anonymes. Mais ici le 
point important est que nous n'avons pas 
a nous en soucier. 
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AV 

Abreviation de « array value », qui se 
refere a Fun des types de donnees interne 
de Perl. Une AV est une sorte de SV 

avertissement 

Un message affiche sur le flux STDERR 
indiquant que quelque chose ne va pas 
mais que ce n'est pas une raison pour tout 
casser. Voir warn dans le chapitre 29, Fonc- 
tions, ainsi que le pragma use warnings 
dans le chapitre 31, Modules de pragmas. 

avide 

Un sous-motif dont le quantificateur cher- 
che a effectuer une correspondance avec le 
maximum de choses. 

awk 

Abreviation du mot « etrange ». Aussi un 
venerable langage de traitement de textes 
auquel Perl a emprunte quelques idees de 
haut niveau. 

backtracking 

En theorie cela revient a dire « si c'etait a 
refaire, je le referais autrement », et en 
pratique avec Perl c'est le refaire vraiment. 
Mathematiquement parlant, il s'agit du 
retour d'une recursion ayant echoue sur 
une arborescence de possibilites. Le back- 
tracking, ou retour arriere, se produit en 
Perl quand il tente de comparer des motifs 
avec une expression reguliere, et que ses pre- 
miers essais ne correspondent pas. Voir 
« Le petit Moteur qui/(ne )?pouvait( pas)?/ » 
au chapitre 5, Recherche de motif. 

bibliotheque 

Une collection de procedures. Aux temps 
hero'iques, se referait a une collection de 
sous-programmes dans un fichier .pi. 
Actuellement, se refere souvent a l'inte- 
gralite des modules Perl d'un systeme. 

binaire 

Ayant a voir avec les nombres representee 
en base deux. Cela veut dire qu'il existe 
deux nombres, zero et un. Designe egale- 
ment un « fichier non-texte », dont le 
codage a ete effectue avec les 8 bits de 
l'octet. Avec l'arrivee d'UNICODE, cette 
distinction perd toute signification. 



bit 

Entier dans l'intervalle 0-1, bornes com- 
prises. La plus petite unite de stockage 
d'information. Un huitieme d'octet ou de 
dollar. (L'expression Pieces of eight, pieces 
de huit, vient de la possibility de diviser 
les vieux dollars espagnols en 8 bits, cha- 
cun restant de l'argent valable. C'est la 
d'ou vient l'expression twobits pour une 
piece de 25 cents. 

bits d'autorisation 

Les bits utilises par le proprietaire d'un 
fichier pour limiter les acces a celui-ci. Ces 
bits font partie du mot mode retourne par 
la fonction stat predefinie lorsque vous 
demandez l'etat d'un fichier. Sur les syste- 
mes Unix, vous pouvez regarder la page de 
manuel /s(l) pour plus d'information. 

bit d'execution 

La marque speciale qui indique au systeme 
d 'exploitation qu'il peut lancer ce pro- 
gramme. II existe en fait trois bits d'execu- 
tion sous UNIX, et le bit utilise depend de 
ce que 1'on possede le fichier individuelle- 
ment, collectivement, ou pas du tout. 

bloc 

Un gros morceau de donnees, d'une taille 
que le systeme d'exploitation apprecie 
(d'habitude une puissance de 2 comme 
512 ou 8192). Cela designe habituellement 
un morceau de donnees venant d'un 
fichier ou y allant. 

BLOCK 

Une construction syntaxique composee 
d'une sequence d'instructions Perl delimi- 
tees par des accolades. Nous parlons par- 
fois de « bloc » pour une sequence 
d'instructions qui agissent comme un 
BLOC, meme non delimitee par des accola- 
des. 

bio que 

Etat d'un processus qui attend une 
ressource : « ce processus est bloque car il 
attend une ressource du disque ». 

Booleen 

Valeur vraie ou fausse. 
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boucle 

Une construction qui effectue quelque 
chose de facon repetee, comme un surfeur 
sur des rouleaux. 

brouillon 

C'est une zone memoire temporaire dans 
laquelle un sous-programme ou un fichier 
place temporairement ses valeurs et aussi 
toute variable a portee lexicale. 

BSD 

Une drogue psychotrope, populaire dans 
les annees 80, probablement developpee a 
l'U.C. Berkeley ou ses environs. Similaire 
par de nombreux points a la medication 
appelee « System V », mais infiniment 
plus utile (ou du moins, plus amusante). 
Le nom chimique complet est « Berkeley 
Standard Distribution » . 

bucket 

Espace dans une table de hachage conte- 
nant plusieurs entrees dont les cles ont 
une valeur de hachage identique. (Cette 
notion est interne a la gestion des tableaux 
faite par Perl et ne vous concerne pas, en 
regie generate.) 

bytecode 

Un baragouin employe par les androides 
quand ils ne veulent pas reveler leur orien- 
tation (voir boutismes). Ainsi denomme 
d'apres certains langages similaires paries 
(pour des raisons similaires) entre les com- 
pilateurs et les interpreteurs a la fin du 
vingtieme siecle. Ces langages sont caracte- 
rises par leur facon de representer par une 
sequence d'octets independante de l'archi- 
tecture. 

C 

Un langage cheri par de nombreuses per- 
sonnes pour ses definitions de types inver- 
sees, ses regies de precedence impenetrates 
et une surcharge importante de ses meca- 
nismes d'appel de fonctions. (En fait, les 
gens sont d'abord passes au C parce qu'ils 
trouvaient les identificateurs en minuscu- 
les plus faciles a lire que ceux en majuscu- 
les.) Vinterpreteur Perl est ecrit en C, et il 
n'est done pas surprenant que Perl lui ait 
emprunte quelques idees. 



canal de sortie actuellement selectionne 

Le dernier handle de fichier ayant ete desi- 
gne par select (FILEHANDLE) ; STDOUT par 
defaut, si aucun handle n'a ete selectionne. 

canonique 

Reduction dans une forme standard qui 
facilite la comparaison. 

capture 

L'utilisation de parentheses autour d'un 
sous-motif dans une expression reguliere 
pour memoriser la sous-chaine correspon- 
dante comme reference arriere. (Les chaines 
capturees peuvent aussi etre retournees 
dans un contexte de liste.) 

caractere 

Un petit entier qui code une unite d'ecri- 
ture. Historiquement, les caracteres sont 
encodes dans un entier de longueur fixe 
(typiquement un octet, voir deux selon le 
type a coder), mais avec 1'apparition du 
codage UTF-8, ils sont codes sur une lon- 
gueur variable. Perl gere ceci d'une 
maniere transparente, en general. 

caractere espace 

Un caractere qui deplace le curseur mais 
n'affiche rien a Fecran. Se refere typique- 
ment aux caracteres suivants : blanc, tabu- 
lation, retour chariot, saut de ligne, saut 
de page. 

caractere nul 

Un caractere ASCII de valeur zero. II est 
utilise par C et certains appels systeme 
UNIX pour terminer les chaines, alors que 
Perl autorise les chaines a contenir un nul. 

chaine 

Une sequence de caracteres telle que « il 
dit !@#*&%@#*?! ». Une chaine n'est pas 
obligatoirement imprimable. 

chaine binaire 

Sequence de bits interpreted comme un 
sequence de bits. 

chaine nulle 

Une chaine ne contenant aucun caractere, 
a ne pas confondre avec une chaine conte- 
nant un caractere nul, qui a une longueur 
positive et une valeur vraie. 
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champ 

Un bout simple de donnees faisant partie 
d'une chaine, d'un enregistrement ou d'une 
ligne. Les champs de longueur variable 
sont generalement separes par des delimi- 
teurs (on utilise split pour extraire les 
champs) alors que les champs de longueur 
fixe se trouvent a des positions constantes 
(on utilise unpack). Les variables d'instances 
sont aussi appelees « champs ». 

chemin 

Un nom de fichier entierement qualifie 
tel /usr/bin/perl. Parfois confondu avec 
PATH. 

classe 

Un type predefini par l'utilisateur imple- 
mente en Perl par la declaration package, 
paquetage qui fournit (directement ou par 
heritage) les me'thodes (c'est-a-dire les sous- 
routines) pour gerer les instances de la 
classe (ses objets). Voir aussi Yhe'ritage. 

classe de base 

Type cTobjet generique dont la classe tres 
abstraite peut etre derivee par heritage vers 
des classes plus specialises. Aussi appele 
« superclasse » dans la tradition de nos 
ancetres. 

classe de caracteres 

Une liste de caracteres entre crochets 
employee dans une expression reguliere 
pour indiquer que tout caractere de 
Pensemble peut se trouver a cet endroit. 
Aussi tout ensemble de caracteres predefi- 
nis. 

classe derivee 

Une classe qui definit certaines de ses 
me'thodes dans les termes d'une classe plus 
generique, appelee classe de base. Remar- 
quez que les classes ne sont par classifies 
exclusivement en classes de base ou classes 
derivees ; une classe peut simultanement 
fonctionner des deux manieres, ce qui est 
typique. 

classe parent 

Voir classe de base. 

clef 

L'index de type chaine d'un hachage, utilise 



pour chercher une valeur associee a une 
certaine clef. 

client 

Dans un contexte de reseau, un processus 
qui prend contact avec un processus ser- 
veur pour echanger des donnees et even- 
tuellement recevoir un service. 

cloisonneur 

Un cluster utilise pour restreindre la por- 
tee d'un modificateur d'expression ration- 
nelle. 

cluster 

Un sous-motif entre parentheses utilise 
pour grouper les parties d'une expression 
rationnelle dans un seul atome. 

CODE 

Mot retourne par la fonction ref appli- 
quee a la reference d'une sous-routine. 
Voir aussi CV. 

commande 

En programmation shell, la combinaison 
syntaxique d'un nom de programme avec 
ses arguments. Plus generalement, tout ce 
que Ton entre dans un shell (un interpre- 
teur de commandes) qui fait quelque 
chose. En programmation Perl, une ins- 
truction, qui peut demarrer par une eti- 
quette et se termine typiquement par un 
point-virgule. 

commentaire 

Une remarque qui n'affecte pas la signifi- 
cation du programme. En Perl, un com- 
mentaire commence par un caractere # et 
continue jusqu'a la fin de la ligne. 

compatibilite ascendante 

Possibilite de faire tourner ses anciens 
fichiers sources sur les nouvelles versions 
de l'interpreteur, car nous n'avons casse ni 
les fonctionalites, ni les bugs sur lesquels 
reposent les anciens programmes. 

compilateur 

Au sens strict, un programme qui en 
absorbe un autre et recrache un troisieme 
fichier contenant ce programme sous une 
forme plus executable, contenant typique- 
ment des instructions en langage machine 
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natif. Le programme perl n'est pas un com- 
pilateur selon cette definition, mais il en 
contient un qui prend un programme et le 
metamorphose sous une forme plus execu- 
table (arbres syntaxiques) a l'interieur du 
processus perl lui-meme, que Vinterpreteur 
interprete ensuite. II existe neanmoins des 
modules d'extension qui permettent a Perl 
d'agir plus comme un vrai compilateur. 
Voir le chapitre 18, Compilation. 

compilation 

Le moment oil Perl essaye de comprendre 
ce que signifie le programme, par opposi- 
tion a celui oil, croyant savoir ce qu'il 
signifie, il essaye de faire ce que le pro- 
gramme lui dit de faire. Voir execution. 

compositeur 

Un « constructeur » pour un referent qui 
n'est pas vraiment un objet, comme un 
tableau ou un hachage. Par exemple, une 
paire d'accolades agissent comme compo- 
siteur de hachage, et une paire de crochets 
agissent comme compositeur de tableau. 
Voir Creation de references au chapitre 8, 
References. 

concatenation 

Coller le museau d'un chat a la queue 
d'un autre. On peut remplacer « chat » 
par « chaine ». 

condition 

Avec des « si ». Voir contexte boole'en. 

connexion 

En telephonie, le circuit electrique tempo- 
raire entre les telephones de Fappelant et 
de l'appele. En reseau, le meme genre de 
circuit temporaire entre un client et un ser- 
veur. 

consacrer 

Perl va classer un referent pour qu'il fonc- 
tionne comme un objet. Voir la fonction 
bless dans le chapitre 29. 

constructeur 

Toute me'thode de classe, me'thode d'instance 
ou sous-programme qui cree, initialise, con- 
sacre et retourne un objet. Le terme est 
quelquefois utilise pour designer un com- 
positeur. 



construction 

Un ensemble syntaxique compose d'ele- 
ments plus petits. Egalement Faction de 
creer un objet grace a un constructeur. 

construire 

Creer un objet avec un constructeur. 

contexte 

L'environnement. Le contexte donne par 
le code environnant determine le genre de 
donnees qu'une expression doit renvoyer. 
Les trois contextes primordiaux sont le 
contexte de liste, le contexte scalaire et le con- 
texte peu importe. Le contexte scalaire est 
parfois subdivise en contexte boole'en, con- 
texte numerique et contexte de chaine. II 
existe aussi un contexte « peu importe » 
(qui est traite au chapitre 2, Composants de 
Perl, si cela vous importe). 

contexte booleen 

Un contexte scalaire particulier utilise dans 
les conditions pour evaluer une valeur sca- 
laire a vrai ou faux. A comparer a revalua- 
tion d'une chaine ou d'un nombre. Voir 
contexte. 

contexte de chaine 

La situation dans laquelle l'environne- 
ment (le code appelant) attend d'une 
expression qu'elle renvoie une chaine. Voir 
aussi contexte et contexte numerique. 

contexte de liste 

La situation dans laquelle un environne- 
ment (le code appelant) attend d'une 
expression qu'elle renvoie une liste de 
valeurs au lieu d'une valeur unique. Les 
fonctions qui desirent une LIST d'argu- 
ments indiquent a ses arguments qu'ils 
doivent produire une liste de valeurs. Voir 
egalement contexte. 

contexte de tableau 

Ancienne expression pour dire contexte de 
liste. 

contexte numerique 

La situation dans laquelle l'environne- 
ment (le code appelant) attend d'une 
expression qu'elle renvoie un nombre. 
Voir aussi contexte et contexte de chaine. 
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contexte scalaire 

La situation dans laquelle l'environne- 
ment (le code appelant) attend d'une 
expression qu'elle renvoie une valeur uni- 
que au lieu d'une liste. Voir egalement con- 
texte et contexte de liste. Un contexte scalaire 
impose parfois des contraintes supplemen- 
taires sur la valeur de retour, voir contexte 
de chaine et contexte nume'rique. Nous par- 
Ions parfois d'un contexte booleen dans les 
conditions, mais cela n'implique aucune 
contrainte supplemental puisque toute 
valeur scalaire, qu'elle soit numerique ou 
chaine, est deja vraie ou fausse. 

contexte vide 

Une forme de contexte scalaire dans lequel 
une expression ne retourne aucune valeur 
et qui n'est utile que pour ses propres effets 
de bord. 

continuation 

Le traitement de plusieurs lignes physiques 
comme une seule ligne logique. Les lignes 
de Makefile sont continuees en mettant un 
antislash avant le saut de ligne. Les en-tetes 
de messages Internet sont continues en 
mettant un espace ou une tabulation apres 
le saut de ligne. Les lignes Perl n'ont pas 
besoin d'un quelconque forme de marque 
de continuation, car les espaces (y compris 
les sauts de ligne) sont joyeusement igno- 
res. En general. 

Le cadavre d'un processus, sous la forme 
d'un fichier laisse dans le repertoire de tra- 
vail du processus, generalement resultant 
de certaines formes d'erreur fatale. 

conversion en chaine 

La production d'une chaine pour represen- 
ter un objet. 

correspondance 

Voir recherche de correspondance. 

CPAN 

« Comprehensive Perl Archive Network » 
ou Reseau detaille des Archives de Perl. 
Voir la preface et le chapitre 22, CPAN, 
pour les details. 

cracker 

Une personne qui viole la securite des sys- 
temes d'exploitation. Un cracker peut-etre 



un vrai hacker ou simplement un script 
kiddie. 

CV 

Une definition de type de « valeur de 
code » (code value). Un CV est une sorte 
de SV. 

datagramme 

Un paquet de donnees, tel un message 
UDP, qui est transmis independament de 
la couche applicative sur le reseau (ce sont 
de paquets IP encapsules dans un proto- 
cole TCP et done invisible depuis votre 
programme.) 

DBM 

Signifie « Data Base Management » , un 
ensemble de routines qui emulent un 
tableau associatif avec des fichiers sur dis- 
que. Les routines emploient un systeme de 
hachage dynamique pour localiser 
n'importe quelle entree en seulement 
deux acces disque. Les fichiers DBM per- 
mettent a un script Perl de conserver un 
hachage entre plusieurs invocations. II est 
possible de lier par tie les variables 
hachage a diverses implementations 
DBM ; voir AnyDBM_File(3) et l'entree 
DB_File au chapitre 32, Modules standards. 

debogueur symbolique 

Un programme permettant {'execution pas 
a pas d'un programme, en arretant pour 
afficher des choses ici et la pour voir si 
quelque chose a mal tourne. L'adjectif 
« symbolique » signifie que 1'on peut dis- 
cuter avec le debogueur en employant les 
memes symboles que ceux qui ont ete uti- 
lises pour ecrire le programme. 

decalage 

Decalage a droite ou a gauche dans un 
mot de la memoire, dont l'effet est de mul- 
tiplier ou de diviser par une puissance de 
2. 

decalage a droite 

Un decalage de bit qui divise un nombre 
par une puissance de 2. 

decalage a gauche 

Un decalage de bits qui multiplie un nom- 
bre par une puissance de deux. 
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declaration 

Une assertion de Pexistence de quelque 
chose, et eventuellement de ce a quoi cela 
ressemble, sans presumer de ce qui va lui 
arriver, ni de quelle facon. Une declaration 
ressemble a la partie d'une recette 
enumerant : « deux tasses de farine, un 
ceuf, quatre ou cinq beaux tetards... » Voir 
son oppose instruction. Remarquez que 
certaines declarations fonctionnent egale- 
ment comme des instructions. Les declara- 
tions de sous-routines forment aussi une 
definition si le corps est fourni. 

declencheur 

Un evenement qui declenche un handler. 

decrementer 

Soustraire une valeur d'une variable 
comme dans « decrement $x » qui sous- 
trait 1 ou « decrementer $x de 3 ». 

defaut (par) 

Une valeur qui est choisie pour vous si 
vous n'en fournissez pas une vous-meme. 

defini 

Possedant une signification. Perl pense 
que certaines des choses que les gens font 
n'ont aucune signification : en particulier 
l'utilisation d'une variable a qui n'a jamais 
ete attribute de valeur, et effectuer des 
operations sur des donnees qui n'existent 
pas. Par exemple, si Ton essaye de lire des 
donnees apres la fin d'un fichier, Perl ren- 
voie une valeur indefinie. Voir egalement 
faux et I'operateur defined au chapitre 29. 

delimiter 

Un caractere ou une chaine qui delimite un 
objet textuel de taille indefinie que Ton ne 
doit pas confondre avec le separateur ou 
terminateur. « Delimiter » veut simple- 
ment dire « entourer » ou « cloturer » 
(comme ces parentheses le font). 

deplacement 

Ou offset : le nombre d'elements a sauter 
apres le debut d'une chaine ou d'un 
tableau pour arriver a une position speci- 
fique. L'offset minimal est done zero et 
non un, car il n'y a rien a sauter pour arri- 
ver au premier element. 



dereferencer 

Un joli terme informatique signifiant 
« suivre une reference vers ce sur quoi elle 
pointe ». Le prefixe « de » indique qu'il 
s'agit d'enlever un niveau $ indirection. 

descripteur 

Voir descripteur de fichier. 

descripteur de fichier 

Le petit numero qu'utilise le systeme 
d'exploitation pour garder la trace du fichier 
ouvert dont on s'occupe. Perl dissimule le 
descripteur de fichier dans un flux d'E/S 
standard, puis attache le flux a un handle 
de fichier. 

destruction globale 

Le ramasse-miettes des globales (et Taction 
de ces destructeurs) qui se produit quand 
Vinterpreteur Perl est arrete. 

destructeur 

Une methode speciale qui est appelee 
quand un objet le demande. La methode 
DESTROY n'effectue pas la destruction a 
proprement parler. Elle donne l'occasion a 
la classe de faire un peu de menage. 

detruire 

Desallouer la memoire d'un referent (mais 
en appelant d'abord sa methode DESTROY, 
si elle existe.) 

diffuser 

Envoyer un datagramme a plusieurs desti- 
nataires simultanement. 

directive 

Une directive pod. Voir le chapitre 26, 
POD. 

distribuer 

Envoyer une chose a sa destination cor- 
recte. Metaphore utilisee pour designer le 
transfert d'un programme vers un autre 
par selection dans une table de fonction 
de references ou bien comme dans le cas 
des methodes d'objets, par le parcours d'un 
arbre d'heritage de classes. 

distribution 

Une version stable d'un systeme ou d'un 
logiciel. Par defaut, le code source est 
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inclus. Dans le cas inverse, elle est dite 
« binary-only ». 

document ici-meme 

Ainsi appele en raison d'une construction 
similaire des shells qui pretendent que les 
lignes suivant « ici meme » la commande 
sont unfichier separe a donner a la com- 
mande, jusqu'a une chaine servant de deli- 
miteur de fin. En Perl, il ne s'agit que d'une 
forme elaboree de protection. 

domaine public 

Qui n'est possede par personne. Perl fait 
l'objet d'un copyright, et n'est done pas 
dans le domaine public ; il n'est que libre- 
ment disponible et librement redistribuable. 

drapeau 

Nous evitons l'utilisation de ce terme qui 
veut tout dire : un se'lecteur de la ligne de 
commande qui ne prend pas d'argument 
(tels -n et -p), un simple bit indicateur 
(tels 0_CREAT et 0_EXCL utilises dans 
sysopen). 

drole de caractere 

Quelqu'un comme Larry, ou les types qui 
lui servent d'amis. Ou bien, l'un de ces 
etranges prefixes devant les noms de varia- 
bles en Perl. 

dweomer 

Un enchantement, une illusion, un phan- 
tasme, ou une acrobatie. Se dit d'un pro- 
gramme Perl qui ne fait pas ce que vous 
attendez de lui, mais plutot quelque chose 
de l'ordre de la sorcellerie. 

dwimmer 

DWIN est un acronyme pour « Do What I 
Mean », principe selon lequel une instruc- 
tion devrait faire ce que vous desirez, sans 
faire de chichis. Un morceau de code qui 
fait du « dwimming » est un 
« dwimmer ». Dwimming necessite sou- 
vent beaucoup de travail en arriere plan et 
si ca se voit ca devient du dweomer. 

eclectique 

Derive de nombreuses sources. Certains 
diraient trop nombreuses. 



edition de lien 

Resolution de noms dans un fichier par- 
tiellement compile afin de produire une 
image (presque) executable. L'edition de 
liens est statique ou dynamique (a ne pas 
confondre avec la portee statique ou dyna- 
mique). 

effets de bord 

Un effet secondaire qui se produit lors de 
1'evaluation d'une expression. Par exemple 
1'evaluation d'une simple affectation a 
pour « effet de bord » d'affecter une 
valeur a une variable (ce qui etait bien 
votre intention premiere!). De meme, 
l'affectation d'une valeur a la variable spe- 
ciale $ | ($AUTOFLUSH) a pour effet de bord 
de forcer un vidage apres chaque write ou 
chaque print sur le handle de fichier cou- 
rant. 

element 

Une brique de base. Quand on parle d'un 
tableau, l'un des items qui le composent. 

emplacement d'objet indirect 

Position syntaxique entre 1'appel d'une 
methode et ses arguments quand la nota- 
tion indirecte est invoquee. La position se 
distingue des arguments par l'absence de 
virgule entre elle et l'argument suivant. 
STDERR est dans un emplacement indirect 
ici : 

print STDERR "Debout! 
Reveillez-vous! Peur, Feu, Folie! 
Debout !\n"; 

en passant 

Quand on change la valeur d'un objet au 
moment de sa copie (de l'expression, prise 
du pion en passant aux echecs). 

encapsulation 

La couche abstraite qui separe {'interface de 
{'implementation, et qui impose que tout 
acces a l'etat d'un objet soit effectue au tra- 
vers de methodes exclusivement. 

enregistrement 

Ensemble de donnees reliees entre elles 
dasn un fichier ou un flux, souvent asso- 
ciees avec une clef unique. Sous Unix, elles 
sont souvent rassemblees sur une ligne ou 
un dans un « paragraphe » (suite de lignes 
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terminee par une ligne vide). Chaque 
ligne du fichier /etc/passwd est un enregis- 
trement dont la clef est le login, et qui 
contient Finformation de l'utilisateur. 

enrobage 

Un programme qui en lance un autre a 
votre place, en modifiant certaines des 
entrees ou des sorties pour mieux vous 
convenir. 

entier 

Un nombre sans partie fractionnaire. Un 
nombre pour denombrer comme 1, 2, 3..., 
en incluant 0 et les nombres negatifs. 

entree standard 

Le flux d'entree par defaut d'un pro- 
gramme, qui doit si possible ne pas s'occu- 
per du lieu de provenance des donnees. 
Represents dans un programme Perl par 
le handle de fichier STDIN. 

environnement 

L'ensemble des variables d 'environnement 
que le processus herite de son parent. 
Accessible via %ENV. 

EOF 

Fin de fichier. Metaphore pour designer la 
chaine indiquant la fin d'un fichier ici- 
meme 

erreur 

Voir exception ou erreur fatale. 

erreur fatale 

Une exception non traitee, qui provoque la 
fin du processus apres impression d'un 
message sur la console d'erreur standard. 
Les erreurs dans un bloc eval ne sont pas 
fatales : le bloc se termine apres avoir 
place le message d'exception dans la varia- 
ble $@ ($EVAL_ERROR). On peut lever expli- 
citement une exception avec l'operateur 
die qui peut etre traitee dynamiquement 
par le bloc eval. S'il ne Test pas, cela pro- 
voque une erreur fatale. 

erreur standard 

Le flux de sortie par defaut qui sert a faire 
des remarques desobligeantes qui ne sont 
pas destinees a la sortie standard. Repre- 
sents en Perl par le handle de fichier 



STDERR. Ce flux peut etre utilise explicite- 
ment, mais les operateurs die et warn le 
font automatiquement. 

errno 

Le numero de l'erreur renvoye par un 
appel systeme UNIX quand il echoue. Perl 
se refere a l'erreur par le nom $! (ou 
$0S_ERR0R si Ton utilise le module 
English). 

E/S standard 

Une bibliotheque standard du C 
(« standard I/O ») servant aux entrees et 
aux sorties i vers le systeme d 'exploitation (le 
« standard » des E/S standard n'a qu'un 
rapport marginal avec le « standard » des 
entrees et sorties standard). En general, 
Perl se base sur l'implementation propre a 
chaque systeme d'exploitation, et les carac- 
teristiques de tamponnage peuvent done 
ne pas exactement correspondre d'une 
machine a l'autre. Cela n'influence nor- 
malement que Pefficacite et non la porta- 
bility. Si les fonctions d'E/S standard 
tamponnent par bloc et qu'il serait souhai- 
table de vider les tampons plus souvent, il 
suffit de mettre la variable $ | a une valeur 
vraie. 

espace de noms 

Un domaine de noms. II n'y a pas besoin 
de se soucier de savoir si les noms d'un tel 
domaine ont ete utilises dans d'autres. 
Voir paquetage. 

est une sorte de 

Relation entre deux objets dans laquelle 
l'un est considere comme une version plus 
specifique de l'autre objet generique : 
« Un chameau est un mammifere ». 
L'objet generique etant une abstraction au 
sens platonique, on parle plutot de rela- 
tion entre une classe de base et une classe 
specifique dite classe derivee. Etrangement, 
les classes abstraites platoniques n'ont pas 
toujours des relations platoniques — voir 
la notion $ heritage. 

etiquette 

Nom donne a une instruction pour pou- 
voir y acceder partout ailleurs dans le pro- 
gramme. 
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etiquette de boucle 

Un genre de clef ou de nom rattache a une 
boucle pour que les instructions de con- 
trole de boucle puissent savoir quelle bou- 
cle elles doivent controler. 

exception 

Un joli nom pour une erreur. Voir erreur 
fatale. 

exec 

Stopper le programme du processus en 
cours pour le remplacer par un autre, 
tout en gardant les ressources en cours 
dans le processus (sauf son image 
memoire). 

executer 

Execution d'un programme ou sous-pro- 
gramme. (Rien a voir avec la fonction 
« tuer » kill, sauf si vous mettez en 
oeuvre un handler de signal.) 

execution 

Le laps de temps pendant lequel Perl 
essaye de faire ce que le script lui ordonne, 
par opposition a la periode precedente 
pendant laquelle Perl essayait de savoir si 
le script avait un sens quelconque a l'exe- 
cution. Voir egalement compilation. 

exporter 

Rendre les symboles d'un module disponi- 
bles depuis un autre par la directive 
import. 

expression 

Tout assemblage de litteraux, variables, ope- 
rateurs,fonctions ou sous-programmes, effec- 
tue suivant les regies, quand on a besoin 
d'une valeur. 

expression alerte 

Une expression qui provoque un arret 
lorsque sa valeur change, ce qui permet de 
deboguer. 

expression reguliere 

Une entite unique avec diverses interpre- 
tations, comme un elephant. Pour un 
informaticien, il s'agit de la grammaire 
d'un petit langage dans lequel certaines 
chaines sont legales et d'autres non. Pour 
les gens normaux, c'est un motif que Ton 



peut utiliser pour trouver ce dont on a 
besoin quand la cible varie selon les cas. 
Les expressions regulieres en Perl sont loin 
d'etre regulieres au sens mathematique du 
terme, mais fonctionnent plutot bien 
lorqu'on les utilise correctement. Exemple 
d'une expression reguliere : /Oh, m . *d . . /. 
Ce motif correspond a des chaines comme 
« Oh, mais vous etiez dans le train allant a 
Lourdes » et « Oh, ma foi, il se fait 
tard ! ». Voir le chapitre 5. 

extension 

Un module Perl qui comporte du code C 
ou C++ compile. Ou plus generalement, 
une option experimentale qui peut etre 
compilee et integree dans Perl, comme le 
multithreading. 

false 

En Perl, toute valeur qui ressemble a "" 
ou "0" dans un contexte de chaine. Tout 
valeur indefinie est done faussse, car eva- 
luee a "", mais toute valeur fausse n'est 
pas forcement indefinie. 

FAQ 

Questions frequemment posees {Fre- 
quently Asked Questions, ou Foire aux Ques- 
tions) (meme les reponses n'y sont pas 
forcement, surtout dans les FAQ de la ver- 
sion courante qui peuvent dater). 

fermeture 

Un sous-programme anonyme qui, genere 
a l'execution, garde trace des identites des 
variables lexicales visibles de l'exterieur 
meme apres que ces variables lexicales 
sont devenues hors de portee. Elles sont 
appelees « fermetures » parce que ce 
genre de comportement donne aux 
mathematiciens un sentiment d'isole- 
ment. 

fichier 

Une collection de donnees nommee, gene- 
ralement stockee sur disque dans un reper- 
toire lui-meme dans un systeme de fichiers. 
Ressemblant vaguement a un document, 
si on apprecie les metaphores d'ordre 
bureautique. Sous quelques systemes 
d 'exploitation comme UNIX, un meme 
fichier peut en fait repondre a plusieurs 
noms. Certains fichiers sont speciaux 
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comme les repertoires et les peripheri- 
ques. 

fichiers d'en tete 

Un fichier contenant certaines definitions 
requises qui doivent etre incluses « en- 
tete » pour pratiquer certaines operations 
obscures. Un fichier d'en-tete C possede 
une extension .h. Un fichier d'en-tete Perl 
possede une extension .ph. Voir l'opera- 
teur require au chapitre 29. (Les fichiers 
d'en-tete ont ete supplantes par le meca- 
nisme de module.) 

fichier executable 

Un fichier marque, reconnu par le systeme 
Sexploitation comme executable. Simple- 
ment appele « executable ». 

fichier normal 

Un fichier qui n'est pas un repertoire, un 
peripherique, un tube nomme, une socket 
ou un lien symbolique. Perl utilise Vope'ra- 
teur de test de fichier -f pour identifier les 
fichiers « normaux ». 

FIFO 

Premier entre, premier sorti, file d'attente. 
Voir aussi UFO. Aussi l'autre nom pour un 
tube nomme. 

fileglob 

Une correspondance par « joker » sur des 
noms de fichier. Voir la fonction glob. 

filtre 

Transforme un flux d'entree en flux de 
sortie. 

filtre source 

Un module special qui opere un pretraite- 
ment sur votre script juste avant Yanalyseur 
lexical. 

flux 

Un flux continu de donnees de type carac- 
teres ou octets entrant ou sortant d'un 
processus sans donner l'impression d'arri- 
ver paquet par paquet. C'est une sorte 
^interface — l'implementation sous- 
jacente est invisible, et peut fort bien grou- 
per les donnees par paquets. 



FMTEYEWTK 

Plus que vous n'avez jamais espere savoir. 
Traite exhaustif sur un sujet pointu, quel- 
que chose comme une super FAQ. Voir 
Tom pour en savoir beaucoup plus. 

fonction 

Mathematiquement, une relation faisant 
correspondre un ensemble de valeurs de 
depart vers un ensemble de valeurs d'arri- 
vee. Dans le langage des ordinateurs, se 
refere a un sous-programme ou un opera- 
teur, avec ou sans valeurs d'entree (appe- 
lees arguments) qui retourne une valeur. 

fonction de rappel 

Un handler declare dans une autre partie 
du programme et qui peut etre declenche 
par un code different lorsqu'un evene- 
ment se produit. 

fork 

Creer un processus fils identique au proces- 
sus pere, du moins jusqu'a ce qu'il se fasse 
ses propres idees. Un thread avec sa 
memoire locale. 

format 

Specification indiquant combien d'espa- 
ces, de chiffres et de choses diverses il faut 
pour que tout ce que vous imprimez 
donne un resultat agreable a regarder. 

freeware 

Logiciel mis a libre disposition, parfois 
avec son code source. On l'appelle mainte- 
nant plutot logiciel a source ouvert. Recem- 
ment, une tendance est apparue qui 
oppose les freewares aux logiciels a source 
ouvert, et qui reserve le terme freeware 
aux logiciels diffuses sous la licence GPL 
de la « Free Software Foundation ». 

generateur de code 

Systeme qui produit du code machine tel 
le code final d'un compilateur. Voir gene- 
rateur de programme. 

generateur de programme 

Un systeme qui ecrit du code pour vous 
dans un langage de haut niveau. Voir aussi 
generateur de code. 
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gestionnaire de signal 

Un sous-programme qui, au lieu de se con- 
tenter d'etre appele de facon normale, 
attend dans son coin qu'un eclair se pro- 
duise soudainement avant de daigner s'exe- 
cuter. En Perl, ces eclairs sont appeles des 
signaux, et elles sont distributes avec la 
fonction predefinie kill. Voir le hachage 
%SIG dans le chapitre 28, Noms spe'ciaux, et 
la section Signaux dans le chapitre 16, Com- 
munication interprocessus. 

GID 

Group ID, identifiant de groupe ; sous 
UNIX, le numero de groupe que le systeme 
d'exploitation utilise pour vous identifier, 
ainsi que tous les utilisateurs de votre 
groupe. 

glob 

Au sens strict, le caractere * du shell, qui 
recherche une correspondance avec un 
« glob » (une palanquee) de caracteres 
quand on essaye de generer une liste de 
noms de fichiers. Plus generalement, le 
fait d'utiliser des globs et des symboles 
similaires afin d'effectuer des recherches 
de correspondances. Voir aussi fileglob et 
typeglob. 

global 

Ce que Ton peut voir de partout, concer- 
nant en general les variables et les sous-pro- 
grammes visibles de partout dans le 
programme. En Perl, seules certaines 
variables sont vraiment globales ; la plu- 
part des variables (comme tous les sous- 
programmes) sont locales au paquetage 
courant. Les variables globales peuvent 
etre declarees avec our. Voir Declarations 
globales dans le chapitre 4, Instructions et 
declarations. 

granularite 

La taille des objets avec lesquels vous tra- 
vaillez. 

grep 

Vient de la vieille commande UNIX 
« Recherche globale d'un expression regu- 
liere et impression » (« Global search for a 
Regular Expression and Print »), utilise 
maintenant pour tout type de recherches 



textuelles. Perl possede une fonction grep 
predefinie qui cherche dans une liste la 
correspondance suivant certains criteres, 
alors que le programme grep(l) cherche 
les lignes qui correspondent a une expres- 
sion reguliere dans un ou plusieurs fichiers. 

gros-boutiste 

Decrit les ordinateurs qui rangent Voctet 
du poids le plus fort d'un mot a une 
adresse plus basse que l'octet du poids le 
plus faible, souvent considered comme 
superieurs aux ordinateurs petit-boutiste. 
D'apres Swift : quelqu'un qui mange les 
ceufs a la coque par le grand bout. Voir 
aussi petit-boutiste. 

groupe 

Un ensemble d'utilisateurs dont on fait 
partie. Sous certains systemes d'exploita- 
tion (comme UNIX), il est possible de 
donner certaines permissions d'acces 
fichier aux autres membres de son groupe. 

groupe de selecteurs 

La combinaison de plusieurs selecteurs 
d'une commande (i.e -a -b -c) en un seul 
(i.e -abc). Un selecteur avec argument doit 
etre place en dernier. 

GV 

Une « valeur glob » (glob value), signifiant 
un typeglob. Un GV est une sorte de SV. 

hachage 

Une liste nommee de paires clef/valeur, 
arrangee de telle maniere qu'il soit facile 
d'utiliser une clef pour trouver sa valeur 
associee ; une relation binaire, pour les 
utilisateurs de bases de donnees. Ce glos- 
saire ressemble a un hachage, oil le mot a 
definir est la clef et la definition est la 
valeur. Un hachage est parfois egalement 
appele un « tableau associatif » en six syl- 
labes (ce qui est une bonne raison pour 
l'appeler un hachage). 

hacker 

Personne pugnace a resoudre les proble- 
mes techniques, quel que soit le sujet qu'il 
s'agisse de jouer au golf, de combattre des 
orques ou de programmer. Hacker est un 
terme neutre, moralement parlant. Les 
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bons hackers ne doivent pas etre confon- 
dus avec les crackers fous ou les script kid- 
dies incompetents. Si vous les confondez, 
nous vous considerons comme fou ou 
incompetent. 

handle de fichier 

Ce avec quoi on selectionne un fichier. Ou 
bien, un nom (qui n'est pas necessaire- 
ment le vrai nom du fichier) qui repre- 
sente une instance donnee d'ouverture 
d'un fichier jusqu'a ce qu'il soit ferine. Si 
I'on doit ouvrir et fermer plusieurs fichiers 
a la suite, il est possible d'ouvrir chacun 
d'entre eux avec le meme handle, ce qui 
fait que Ton n'a pas a reecrire du code 
pour traiter chacun d'entre eux. 

handle de fichier indirect 

Une expression dont la valeur est un handle 
de fichier : une chaine (nom de handle de 
fichier), un typeglob, une reference de type- 
glob, ou un objet de bas niveau du 
module 10. 

handle de repertoire 

Un nom representant une instance don- 
nee de repertoire ouvert, jusqu'a ce qu'il 
soit ferme. Voir la fonction opendir. 

handler 

Un sous-programme ou methode appele par 
Perl quand votre programme doit repon- 
dre a un evenement interne tel un signal, 
ou bien la rencontre avec un operateur de 
surcharge. Voir aussi fonction de rappel. 

heritage 

Ce que nous laissent nos ancetres, en ter- 
mes genetiques ou autres. Si vous etes une 
classe, vos ancetres sont appeles classes de 
base et vos descendants classes derivees. Voir 
aussi {'heritage simple et heritage multiple. 

heritage multiple 

Les caracteristiques de votre mere et de 
votre pere, melangees de facon imprevisi- 
ble (voir heritage et heritage simple). Dans 
les langages informatiques (y compris 
Perl), la notion selon laquelle une classe 
donnee peut avoir plusieurs ancetres 
directs ou classes de base. 



heritage simple 

Les caracteristiques heritees de votre mere, 
si elle vous a raconte que vous n'aviez pas 
de pere (voir egalement heritage et heritage 
multiple). Dans les langages informatiques, 
la reproduction des classes est asexuee, et 
une classe donnee ne peut avoir qu'un 
seul ancetre direct ou classe de base. Perl 
ne connait pas ces restrictions, meme si 
c'est possible de faire de cette maniere. 

hexadecimal 

Un nombre en base seize, parfois raccourci 
en « hexa ». Les chiffres allant de dix a 
quinze sont conventionnellement repre- 
sented par les lettres allant de a a f. Les 
constantes hexadecimales commencent 
par 0 en Perl. Voir aussi la fonction hex au 
chapitre 29. 

hote 

L'ordinateur sur lequel reside un pro- 
gramme ou des donnees. 

HV 

Abreviation de « hash value » (valeur de 
hachage), qui se refere a l'un des types de 
donnees internes de Perl. Un HV est une 
sorte de SV. 

identificateur 

Un nom legalement forme pour tout ce 
qui peut interesser un programme infor- 
matique. De nombreux langage (y com- 
pris Perl) autorisent les identificateurs 
commencant par une lettre et contenant 
des lettres et des chiffres. Perl considere 
egalement le caractere souligne comme 
une lettre valide. (Perl dispose aussi d'une 
notation complexe avec les noms quali- 
fies.) 

impatience 

La colere qui vous saisit quand l'ordina- 
teur paresse. Vous etes alors pousse a 
ecrire des programmes qui ne se conten- 
tent pas de repondre a vos besoins, mais 
aussi a les anticiper. Idealement. En conse- 
quence, la deuxieme grande vertu du pro- 
grammeur. Voir egalement paresse et 
orgueil. 

implementation 

La maniere dont un morceau de code fait 
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reellement son travail. Les utilisateurs 
n'ont pas a s'occupper des details de 
^implementation a moins qu'elle ne soit 
disponible a travers son interface. 

importer 

Avoir acces a des symboles qui sont expor- 
ted depuis un autre module. Voir l'opera- 
teur use au chapitre 29. 

incrementation magique 

Un operateur ^incrementation qui sait 
comment ajouter 1 tant a une chaine 
alphanumerique qu'a un nombre. 

incrementer 

Augmenter une valeur d'une unite (ou de 
tout autre nombre, si specifie). 

indexation 

A l'origine, rechercher une clef dans un 
index (comme un annuaire), mais de nos 
jours, il s'agit surtout d'utiliser une clef ou 
une position pour trouver la valeur corres- 
pondante, meme alors qu'aucun index 
n'entre en jeu. La situation a tellement 
degenere que la fonction index de Perl se 
contente de localiser la position d'une 
chaine dans une autre. 

indice 

Une valeur indiquant la position d'un ele- 
ment d'un tableau. 

indirection 

Quelque chose qui indique ou se trouve la 
valeur cherchee. Ce qui peut se faire avec 
des references symboliques ou des references 
dures. 

infixe 

Un operateur qui se place entre ses operan- 
des, tel la multiplication dans 24 * 7. 

insere 

Quand une chose est contenue dans une 
autre, meme si c'est parfois surprenant : 
« J'ai insere un interpreteur Perl dans 
mon editeur ! ». 

instance 

Raccourci pour « instance de classe » qui 
signifie un objet de cette classe. 



instruction 

Une commande a l'ordinateur concernant 
ce qu'il faut faire ensuite, comme une 
etape dans une recette : « Ajouter du 
rhum a la pate et melanger ». A ne pas 
confondre avec une declaration, qui ne dit 
pas a l'ordinateur de faire quoi que ce soit, 
mais d'apprendre quelque chose. 

instruction de controle de boucle 

Une instruction dans le corps de la boucle 
qui peut arreter le bouclage ou sauter une 
iteration. Voir la phrase du milieu de 
l'entree precedente. N'essayez pas cela sur 
un vrai rouleau sans parachute. 

instruction pendante 

Une instruction simple, sans aucune acco- 
lade, apres une condition if ou while. Le 
langage C les autorise mais pas Perl. 

instruction switch 

Une construction de programmation qui 
permet d'evaluer une expression et, d'apres 
la valeur de l'expression, d'effectuer un 
debranchement a choix multiple vers le 
code approprie pour cette valeur. Egale- 
ment appele une « structure case » 
d'apres la construction Pascal similaire. La 
plupart des instructions switch en Perl 
sont des enumerations for. Voir Structures 
de cas dans le chapitre 4. 

interface 

Les services qu'un morceau de code pro- 
met de fournir, en constraste de son imple- 
mentation, qu'il peut modifier a son gre. 

interpolation 

L'insertion d'un scalaire ou d'une liste au 
milieu d'une autre valeur, sans que cela se 
voit. En Perl, l'interpolation de variable se 
produit dans les chaines entre guillemets 
doubles et dans les motifs, et l'interpola- 
tion de liste se produit dans la construc- 
tion d'une liste a passer en parametre a un 
operateur de liste ou tout autre construc- 
tion qui prend une LIST. 

interpolation de variable 

^interpolation d'une scalaire ou d'un 
tableau en une chaine. 
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interpreteur 

Au sens strict, un programme qui lit un 
second programme et fait ce que ce der- 
nier lui dit sans d'abord le transformer 
sous une forme differente, ce qui est le 
comportement des compilateurs. Perl n'est 
pas un interpreteur selon cette definition, 
car il contient un compilateur qui prend 
un programme et en produit un {arbre syn- 
taxique), dans le processus Perl lui-meme, 
qu'interprete ensuite la machine virtuelle 
Perl temps-reel. 

invocation 

Le fait d'appeler une divinite, un demon, 
un programme, un sous-programme ou 
une fonction pour qu'il fasse ce qu'il a a 
faire. Les fonctions ou sous-programmes 
sont usuellement « appeles » alors que les 
methodes sont « invoquees », ca sonne 
mieux. 

I/O 

Entree depuis, ou sortie vers un fichier ou 
peripherique. 

IO 

Un objet I/O interne. Peut aussi vouloir 
dire objet indirect. 

IP 

Protocole Internet, ou propriete intellec- 
tuelle. 

IPC 

« Interprocess Communication », com- 
munication interprocessus. 

iteration 

Faire une chose a repetition. 

iterateur 

Un machin de programmation special qui 
garde tout seul la trace de Piteration a 
l'endroit oil Ton se trouve. La boucle Perl 
f oreach contient un iterateur ; ainsi que le 
hachage, ce qui permet de lui appliquer 
l'operateur each pour le parcourir. 

IV 

IV veut dire la Valeur interne Entiere 
qu'un type scalaire peut porter, a ne pas 
confondre avec NV. 



JAPH 

« Just Another Perl Hacker », un bout de 
code trappu, mais illisible, qui lorsqu'exe- 
cute s'evalue a cette chaine. Souvent uti- 
lise pour illustrer certaine particularites de 
Perl, et dans les concours de Perl obscurci. 

langage rassembleur 

Un langage, tel Perl, bon pour rassembler 
des choses differentes entre elles, qui 
n'etaient pas prevues pour s'assembler. 

le plus a gauche, le plus long 

Priorite d'une expression re'guliere pour eta- 
blir la correspondance sur le motif le plus a 
gauche, et a partir de cette position 
d'essayer la plus longue (en supposant 
1'usage d'un quantificateur avide). Voir le 
chapitre 5 pour en savoir beaucoup plus 
sur le sujet. 

lexeme 

Terme amusant pour dire token. 
lexeur 

Terme amusant pour dire analyseur lexical. 

lexicale typee 

Une variable lexicale declaree avec un type 
classe : my Poney $bill. 

librement diffusable 

Signifie que Ton ne risque rien a en don- 
ner des copies piratees a des amis, meme si 
cela se sait. N'hesitez pas a le faire pour 
Perl. 

librement disponible 

Signifie qu'il n'est pas besoin de payer 
pour l'obtenir, mais le copyright peut tou- 
jours rester propriete de quelqu'un d'autre 
(comme Larry). 

lien 

Utilise comme nom, un repertoire repre- 
sentant un fichier. Un fichier donne peut 
avoir plusieurs liens, comme quand plu- 
sieurs noms de l'annuaire se rapportent au 
meme numero de telephone. 

lien symbolique 

Un nom de fichier supplementaire qui 
pointe sur le vrai nom de fichier, lequel a 
son tour pointe sur le fichier. Quand le sys- 
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teme d 'exploitation essaye d'analyser un 
nom de chemin contenant un lien symbo- 
lique, il se contente de substituer le vrai 
nom et continue l'analyse. 

lier 

Associer une adresse reseau a une socket. 
LIFO 

Dernier arrive, premier sorti. Voir aussi 
FIFO. Une LIFO est plutot appele une pile. 

ligne 

Sous UNIX, une sequence de zero, un ou 
plusieurs caracteres autres que le saut de 
ligne, terminee par un caractere saut de 
ligne. Sur les machines non UNIX, ce con- 
cept est emule meme si le systeme d'exploi- 
tation sous-jacent a sa propre idee sur la 
question. 

lisible 

1) Fichier dont le bit d'autorisation ade- 
quat est a 1, ce qui permet faeces en lec- 
ture. 2) Programme informatique assez 
bien ecrit pour que quelqu'un d'autre 
puisse revenir plus tard en ayant une 
chance de comprendre ce qu'il fait. 

LIST 

Une construction syntaxique representant 
une liste d'expressions separees par des vir- 
gules, dont 1'evaluation produit une liste 
de valeurs. Chaque expression dans une 
LIST est evaluee dans un contexte de liste et 
interpolee en une liste de valeurs. 

liste 

Une liste ordonnee de valeurs. 
liste nulle 

Une valeur de liste de zero elements, repre- 
sented en Perl par (). 

litteral 

Un token tel un nombre ou une chaine qui 
vous donne une valeur effective au lieu de 
simplement contenir une valeur, ce que 
fait une variable. 

litteral scalaire 

Un nombre ou une chaine entre 
apostrophes ; une vraie valeur dans le texte 
du programme, par opposition avec une 
variable. 



local 

Ne signifiant pas la meme chose partout. 
Une variable globale Perl peut etre rendue 
locale a une portee dynamique par 1'opera- 
teur local. Voir portee dynamique. 

logiciel a source ouvert 

Programmes dont le code source est libre- 
ment disponible et que Ton peut redistri- 
buer sans droit commerciaux attache. 
Pour une definition plus detaillee, voir 
http://www.opensource.org/osd.html. 

longueur zero 

Une assertion qui correspond a une chaine 
nulle entre deux caracteres. 

lvalue 

Terme utilise par les puristes des langages 
informatiques (et abhorre par les puristes 
des langages humains) concernant un 
endroit auquel une nouvelle valeur peut 
etre assignee, comme une variable ou un 
element de tableau. Le « 1 » signifie 
« left », pour le cote « gauche » d'une assi- 
gnation, un endroit typique pour une lva- 
lue. Une fonction ou expression 
« normale » a laquelle on peut affecter 
une valeur comme dans pos($x) = 10. 

magique 

Semantique attachee aux variables telles 
que $ ! , $0, %ENV %SIG, ou tout autre varia- 
ble liee. Des choses magiques se produi- 
sent lors de l'utilisation de ces variables. 

Makefile 

Un fichier qui controle la compilation 
d'un programme. Les programmes Perl 
n'en ont pas besoin en general, car le com- 
pilateur a beaucoup de self-control. 

man 

Le programme Unix qui affiche la docu- 
mentation en ligne (pages de manuel). 

marque 

Caracteristique de donnees pouvant pro- 
venir des doigts malodorants d'un utilisa- 
teur, et done dangereux du point de vue 
d'un programme securise. Perl effectue 
des verifications d'entachement (« taint 
checks ») si on lance un programme setuid 
(ou setgid) ou si Ton active Foption -T. 
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membre 

Voir variable d'instance. 

memoire 

Concerne toujours la memoire principale, 
jamais le disque. La memoire virtuelle 
laisse croire que la memoire est plus 
importante, mais on ne peut la substituer 
a la memoire physique. La seule difference 
en cas de limite memoire atteinte, est que 
le systeme mettra plus de temps a crasher, 
alors qu'avec la memoire physique il 
s'arretera tout de suite. 

memoire partagee 

Un morceau de memoire accessible par 
deux processus differents qui autrement 
ne pourraient voir la memoire de l'autre. 

metacaractere 

Un caractere qui n'est pas cense etre traite 
normalement. Le choix des caracteres a 
traiter de maniere speciale comme meta- 
caracteres varie grandement avec le con- 
texte. Le shell peut en accepter certains, les 
chaines Perl protegees par des apostrophes 
doubles en ont d'autres, et les motifs 
d'expression reguliere connaissent ces der- 
niers plus d'autres encore. 

metasymbole 

Une sequence de caracteres dont le pre- 
mier est un metacaractere. 

methode 

L'action que fait un objet quand on lui 
demande. Voir le chapitre 12, Objets. 

methode d'acces 

Une methode permettant de lire ou de 
modifier une variable d'instance d'un 
objet. 

methode de classe 

Une methode dont l'invocant est le nom 
d'un paquetage et non une reference 
d'objet. Cette methode s'applique a la 
classe entiere. 

methode statique 

Ne se dit pas. Voir methode de classe 

minimalisme 

La croyance selon laquelle « moins c'est 
mieux ». Paradoxalement, lorsque 1'on dit 



quelque chose dans un petit langage, on 
obtient un grand discours, et lorsque Ton 
dit la meme chose dans un grand langage 
on obtient un petit discours. Allez savoir. 

mode 

Dans le contexte de 1'appel systeme stat(2), 
se refere au mot contenant les permissions 
et le type du fichier. 

modificateur 

Voir modificateur d'instruction, modificateur 
d'expression reguliere, et modificateur de lva- 
lue. 

modificateur de lvalue 

Pseudo-fonction adjective qui qualifie la 
portee d'une declaration de variable. II y a 
actuellement 3 modificateurs de lvalue : 
my, our, et local. 

modificateur d'expression reguliere 

Une option sur un motif ou une substitu- 
tion telle que /i pour rendre le motif 
insensible a la casse. Voir aussi cloisonneur. 

modificateur d'instruction 

Une condition ou une boucle que vous met- 
tez apres une instruction au lieu de la met- 
tre devant, si vous voyez ce que je veux 
dire. 

module 

Un fichier qui definit un paquetage (pres- 
que) du meme nom, qui peut aussi bien 
exporter des symboles que fonctionner 
comme une classe d'objet. (Le fichier prin- 
cipal .pm d'un module peut aussi inclure 
d'autres fichiers). Voir l'operateur use. 

modulo 

Un entier, quand on est plus interesse par 
le reste que par le quotient. 

mongueur 

Raccourci pour Perl mongueur, un four- 
nisseur de Perl. 

mortel 

Une valeur temporaire prevue pour durer 
le temps d'une instruction. 

mot 

En « informaticianais », le bout de don- 
nees de la taille la plus efficace pour un 
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ordinateur, typiquement 32 bits a quel- 
ques puissances de deux pres. Dans la cul- 
ture Perl, se refere souvent a un 
identificateur (avec ou sans caractere alpha- 
numerique), ou a une chaine de caracteres 
sans espaces delimitee par des espaces ou 
des limite de chaine. 

mot-cle 

Voir mots reserves. 

mot simple 

Un mot suffisamment ambigu pour que 
Perl l'estime illegal, lorsque la directive 
use strict 'subs' est en vigueur. Sans 
cette directive, ce mot isole est traite 
comme avec des guillemets. 

motif 

Modele utilise en reconnaissance de corres- 
pondance. 

motif a Pexecution 

Un motif qui contient une ou plusieurs 
variables a interpoler avant que ce motif 
soit analyse comme une expression regu- 
liere, et qui ne peut done pas etre analyse a 
la compilation, mais doit etre reanalyse a 
chaque fois que l'operateur de recherche 
de correspondance est evalue. Les motifs 
d'execution sont utiles mais couteux. 

mots reserves 

Un mot-clef possedant une signification 
interne specifique pour un compilateur, 
comme if ou delete. En de nombreux 
langages (pas en Perl), il est illegal d'utili- 
ser des mots reserves pour nommer quoi 
que ce soit d'autre (e'est d'ailleurs pour- 
quoi ils sont reserves, apres tout). En Perl, 
il est simplement interdit de les utiliser 
pour nommer les etiquettes et les handles de 
fichiers. Aussi appeles mot-cle. 

nettoyer 

Derniere operation effectuee par un pro- 
cessus parent lors de la terminaison d'un 
processus fils de telle sorte qu'il ne reste 
pas en memoire. Voir les appels des fonc- 
tions wait et wait. 

NFS 

Systeme de fichiers en reseau qui permet 
de monter un systeme de fichier distant 
comme s'il etait local. 



nom de commande 

Le nom du programme en cours d'execu- 
tion, tel qu'il a ete entre sur la ligne de 
commande. En C, le nom de la commande 
est passe au programme comme premier 
argument. En Perl, il est connu sous le 
nom de $0, et separe des arguments. 

nom de fichier 

Le nom donne a un fichier. Ce nom est 
liste dans un repertoire, et on peut l'utiliser 
dans une instruction open pour indiquer 
au systeme d 'exploitation quel fichier ouvrir 
exactement, et l'associer a un handle de 
fichier qui servira d'identite pour les acces 
suivants dans votre programme jusqu'a sa 
fermeture. 

nombre en virgule f lottante 

C'est la « notation scientique » qui permet 
de representer les nombres avec une preci- 
sion independante de l'ordre de grandeur 
(le point decimal flotte). Perl effectue les 
calculs numeriques avec des nombres a 
virgule flottante (parfois appeles des 
« flottants ») lorsque les entiers ne suffi- 
sent plus. Ce sont des approxiations des 
nombres reels. 

normale 

Qui peut servir de lvalue. 

numero de ligne 

Le nombre de lignes avant celle-ci, plus 1. 
Perl conserve un numero de ligne separe 
pour chaque script ou fichier d'entree 
qu'il ouvre. Le numero de ligne du script 

courant est represente par LINE . Le 

numero de ligne d'entree courant (du 
fichier qui a ete le plus recemment ouvert 
par <FH>) est represente par la variable $. 
($INPUT_LINE_NUMBER). De nombreux 
messages d'erreur renvoient les deux 
valeurs, si elles sont disponibles. 

NV 

Valeur numerique interne du type virgule 
flottante qu'un scalaire peut representer, a 
ne pas confondre avec IV. 

objet 

Une instance de classe. Quelque chose qui 
« sait » a quoi il ressemble, et ce qu'il peut 
faire car il connait sa classe. Le programme 
peut demander a un objet de faire des cho- 
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ses, mais c'est Pobjet qui decide s'il veut le 
faire ou non. Certains sont plus accomo- 
dants que d'autres. 

objet indirect 

Terme grammatical indiquant le comple- 
ment d'objet indirect beneficiaire ou 
recepteur de Taction. En Perl, Tinstruc- 
tion print STDOUT "$foo\n"; peut etre 
interpreted grammaticalement comme 
« verbe objet-indirect objet » oil STDOUT 
est le recepteur de Taction print, et 
"$-foo" est Tobjet imprime. De la meme 
maniere, quand on invoque une methode 
on place Tinvocant entre la methode et les 
arguments : 
$golem = 

newCreature: : Pathetique"Smeagol" ; 
donner $gollum "Poisson!"; 
donner $gollum "Tressor!"; 

octal 

Un nombre en base huit. Seuls les chiffres 
allant de zero a sept sont autorises. Les 
constantes octales commencent par un 
zero en Perl, comme pour 013. Voir aussi 
la fonction oct. 

octet 

Un bout de donnees long de huit bits la 
plupart du temps. 

one-liner 

Un programme entier concentre sur une 
ligne de texte. 

operande 

Une expression qui donne une valeur sur 
laquelle un ope'rateur agit. Voir aussi prece- 
dence. 

operateur 

Une fonction, generalement integree au 
langage, souvent avec une syntaxe ou un 
symbole special, qui transforme des 
entrees en sorties. Un operateur donne 
peut attendre des types de donnees specifi- 
ques en tant qu'arguments {operandes), 
ainsi qu'en tant que resultat. 

operateur arithmetique 

Un symbole tel que + ou ** qui indique a 
Perl d'effectuer un calcul arithmetique, tel 
un de ceux appris a Tecole. Voir egalement 
ope'rateur. 



operateur binaire 

Un ope'rateur qui prend deux operandes. 

operateur circonfixe 

Un ope'rateur qui entoure ses operandes, 
commme Toperateur d'angle ou les paren- 
theses, ou une embrassade. 

operateur d'adressage 

Certains langages travaillent directement 
avec les valeurs des adresses memoire, ce 
qui peut etre dangereux. Perl fournit des 
gants isolants pour ce genre d'operation. 
L'operateur le plus proche en Perl est le 
backslash qui s'evalue a une reference dure 
beaucoup plus sure qu'une adresse 
memoire. 

operateur d'affectation 

Soit une affectation reguliere, soit un ope- 
rateur compose, forme par Tassociation 
d'une affectation ordinaire avec un autre 
operateur qui modifie la valeur d'une 
variable en place, c'est-a-dire relativement 
a son ancienne valeur. Par exemple, 
$a += 2 ajoute 2 a $a. 

operateur de liste 

Un ope'rateur comme join ou grepqui agit 
sur une liste de valeurs. Habituellement 
utilise pour designer des operateurs prede- 
finis (tels print, unlink, et system qui ne 
necessitent pas de parentheses autour de 
leurs liste d'arguments. 

operateur de test de fichier 

Un operateur interne de Perl qui permet 
de determiner si quelque chose est vrai 
concernant un fichier, tel le test -o $f ile- 
name qui retourne vrai si vous etes pro- 
prietaire du fichier. 

operateur logique 

Symboles representant les concepts « et » , 
« ou » , « ou exclusif » et « non » . 

operateur relationnel 

Un operateur qui indique si une relation 
d'ordre donnee est vraie concernant une 
paire d'ope'randes. Perl possede des opera- 
teurs relationnels sur les chaines et sur les 
nombres. Voir sequence de tri. 

operateur unaire 

Un operateur avec un seul operande, 
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comme ! ou chdir. Ce sont en general des 
operateurs prefixes, ils precedent leurs 
operandes. Les operateurs ++ et -- sont 
prefixes ou postfixes. (Leur position modi- 
fie leur sens.) 

operation atomique 

Lorsque Democrite inventa le mot 
« atome » pour designer la plus petite 
quantite de matiere, il voulait dire literale- 
ment insecable a- (privatif) suivi de tomos 
(secable) : insecable. Une operation atomi- 
que est une action qui ne peut etre inter- 
rompue. 

options 

Voir selecteurs ou modificateur d'expression 
rationnelle. 

orgueil 

Fierte excessive, le genre de chose qui 
attire les foudres de Jupiter. Mais aussi une 
qualite qui fait ecrire (et maintenir) des 
programmes dont les autres ne voudront 
pas dire de mal. En consequence, la troi- 
sieme grande vertu du programmeur. Voir 
egalement paresse et impatience. 

pad 

Contraction de « scratchpad », voir 
brouillon. 

page de manuel 

Une « page » des manuels UNIX 
(« manpage »), a laquelle on accede typi- 
quement par la commande man{\). Une 
page de manuel contient un synopsis, une 
description, une liste de bogues, etc., et est 
generalement plus longue qu'une page. II 
existe des pages de manuel documentant 
les commandes, les appels systemes, les fonc- 
tions de bibliotheque, les peripheriques, les 
protocoles, les fichiers, et ainsi de suite. 
Dans ce livre, toute partie de la docmenta- 
tion Perl standard telle perlop ou perldelta, 
est appelee page de manuel independam- 
ment du format utilise par votre systeme. 

paquet 

Groupe de modules communs sur CPAN. 
(Denomme parfois aussi un groupe 
d'options de la ligne de commande ras- 
sembles en une groupe d'options.) 



paquetage 

Un espace de noms pour les variables globa- 
les, les sous-programmes et autres, qui les 
distinguent de ceux de meme noms dans 
un autre espace. En un sens, seul un 
paqueage est global puisque on accede a 
un symbole de sa table en nommant ce 
paquetage. Mais dans un autre sens, tous 
les symboles des packages sont globaux, 
mais organises comme il faut. 

paquetage courant 

Le paquetage dans lequel le code en cours 
est compile. Parcourez votre code en 
arriere dans la portee lexicale courante et 
les portees englobantes. La premiere 
declaration « package » que vous trouvez 
est le paquetage courant. 

parametre 

Voir argument. 

paresse 

La qualite qui vous pousse a fournir des 
efforts surhumains dans le but de reduire 
le travail total. Vous etes ainsi conduit a 
ecrire des programmes qui, au total, eco- 
nomisent un dur labeur et que d'autres 
trouvent utiles, et a documenter ce que 
vous avez ecrit pour ne pas devoir repon- 
dre sans arret aux memes questions. En 
consequence, la premiere grande vertu du 
programmeur. Voir aussi impatience et 
orgueil. 

patch 

Dans le monde des hackers, une liste des 
differences entre deux versions d'un pro- 
gramme que Ton peut appliquer avec le 
programme patch{\) pour la mise a jour 
ou la correction d'un bogue. 

PATH 

La liste de repertoires qu'examine le sys- 
teme pour trouver un programme a execu- 
ter. La liste est stockee dans une variable 
d'environnement, accessible en Perl par 
$ENV{PATH}. 

peripherique 

Un super materiel de la mort (comme un 
disque, une unite a bande, un modem ou 
un joystick) rattache a l'ordinateur que le 

systeme d 'exploitation essaye de faire ressem- 
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bier a un fichier (ou a un groupe de 
fichiers). Sous UNIX, ces faux fichiers ten- 
dent a resider dans le repertoire /dev. 

petit-boutiste 

Decrit les ordinateurs qui rangent {'octet 
du poids le plus fort d'un mot a une 
adresse plus haute que Foctet du poids le 
plus faible, souvent considered comme 
superieurs aux ordinateurs gros-boutiste, 
d'apres Swift : quelqu'un qui mange les 
oeufs a la coque par le petit bout. 

phase de compilation 

Phase avant l'execution. Voir aussi phase 
d 'execution. Elle effectue surtout de la com- 
pilation, mais elle peut egalement effec- 
tuer un peu ^'execution dans revaluation 
des blocs BEGIN, des declarations use ou 
des sous-expressions constantes. Le code de 
demarrage et d'importation des declara- 
tions use est aussi execute dans cette 
phase. 

phase d'execution 

Des que Perl commence a executer votre 
programme. Voir aussi phase de compila- 
tion. La phase d'execution effectue surtout 
de {'execution, mais elle peut effectuer de la 
compilation lorsqu'elle execute les opera- 
teurs require, do FILE, or eval STRING, 
ou lorsqu'une substitution utilise le modi- 
ficateur /ee. 

pile 

Un dispositif qui permet d'empiler des 
objets dessus et plus tard de les recuperer 
dans l'ordre inverse. Voir LIFO. 

pipeline 

Une serie de processus en ligne, relies par 
des tubes, oil chacun passe sa sortie au sui- 
vant. 

plateforme 

Le contexte hardware et software dans 
lequel un programme tourne. Un pro- 
gramme ecrit dans un langage qui depend 
d'une plate-forme peut crasher si vous 
changez Fune des choses suivantes : la 
machine, le systeme d'exploitation, les 
bibliotheques, le compilateur ou la confi- 
guration du systeme. L'interpreteur perl 
doit etre recompile a chaque portage car il 



est ecrit en C, mais les programmes ecrits 
en Perl sont dans une large mesure inde- 
pendants de la plateforme. 

pod 

Les balises pour inclure la documentation 
dans votre code. Voir chapitre 26, POD. 

point d'arrets 

Une ligne marquee dans le source ou le 
deboggueur stoppe l'execution, afin de 
pouvoir jeter un coup d'ceil et voir si quel- 
que chose a commence a mal fonctionner. 

pointeur 

Une variable dans un langage comme C 
qui contient Femplacement exact d'un 
autre element. Perl gere les pointeurs en 
interne et Ton n'a pas besoin de s'en sou- 
cier. On utilise des pointeurs symboliques 
sous la forme de clefs et de noms de varia- 
bles, ou de references en dur, qui ne sont pas 
des pointeurs (mais agissent comme tels 
et, en fait, contiennent des pointeurs). 

polymorphisme 

Le fait de pouvoir dire a un objet de faire 
quelque chose de generique, et l'objet 
l'interpretera de diverses facons, en fonc- 
tion de sa forme (vient du Grec, formes 
nombreuses). 

port 

La partie de l'adresse d'une socket TCP ou 
UDP qui dirige les paquets vers le proces- 
sus correct apres avoir trouve la bonne 
machine, un peu comme le numero de 
poste de quelqu'un a qui Ton veut tele- 
phoner au bureau. 

portable 

II y a longtemps, du code compilable a la 
fois sur BSD et SysV En general, du code 
qui est relativement facile a convertir pour 
fonctionner sur une autre plateforme. On 
peut considerer que tout code est portable, 
il suffit d'y mettre du sien. 

portage 

Se dit aussi de la conversion du code 
machine vers une autre machine. 

portee 

Distance a laquelle une variable reste visi- 
ble, du point de vue d'une autre variable. 
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Perl comprend deux mecanismes de 
visibilite : la portee dynamique d'une varia- 
ble locale, ce qui veut dire que le reste du 
bloc et tous les sous-programmes appeles 
dans le reste du bloc peuvent voir les 
variables locales au bloc ; et la portee lexi- 
cale des variables my, ce qui signifie que le 
reste du bloc peut voir les variables, mais 
ce n'est pas le cas pour les autres sous-pro- 
grammes appeles par le bloc. 

portee dynamique 

Les variables a portee dynamique sont 
visibles dans tout le reste du bloc dans les- 
quelles elles ont ete d'abord utilisees, ainsi 
que dans les sous-programmes appeles par 
le reste du bloc. Les variables a portee 
dynamique peuvent voir leur valeur tem- 
porairement modifiees (et restaurees 
implicitement plus tard) par une instruc- 
tion local. Comparer avec portee lexicale. 
Employe plus generalement pour decrire 
la facon dont un sous-programme en train 
d'en appeler un autre « contient » ce sous- 
programme a {'execution. 

portee lexicale 

La zone d'influence du Dictionnaire de 
l'Academie Francaise (connue egalement 
sous le nom de portee statique, vu la 
periode de renouvellement du diction- 
naire en question). De meme, la propriete 
de variables rangees dans un dictionnaire 
propre a chaque bloc (espace de nom), qui 
ne sont visibles que du point de leur decla- 
ration a la fin du bloc dans lequel elles ont 
ete declarees. — Syn. portee statique. — 
Ant. portee dynamique. 

portee statique 

Ne se dit pas. Voir portee lexicale. 

porteur 

Une personne qui « porte » le logiciel 
d'une plate-forme vers une autre. Le por- 
tage de programmes ecrits en C peut etre 
un travail difficile, mais celui d'un inter- 
preter Perl est tres complexe, mais la 
recompense est en proportion. 

POSIX 

La specification des systemes d'exploita- 
tion portables. 



postcurseur 

Une assertion qui cherche la chaine a 
droite de la correspondance courante. 

postfixe 

Un ope'rateur qui suit son operande comme 
dans $x++. 

PP 

Une abreviation pour le code « push- 
pop » qui implemente en C la machine a 
pile de Perl. 

pragma 

Un module de bibliotheque dont les sug- 
gestions et les conseils pratiques sont recus 
(et parfois ignores) par le compilateur. Les 
pragmas ont des noms en caracteres 
minuscules. 

precedence 

Les regies de conduite qui, en l'absence 
d'autres directives, determinent ce qui doit 
se produire en premier. Par exemple, en 
l'absence de parentheses, la multiplication 
se produit toujours avant l'addition. 

precurseur 

Une assertion qui cherche la chaine a gau- 
che de la correspondance courante. 

predefini 

Une fonction predefinie du langage. Meme 
si elle est surchargee, on peut toujours y 
acceder en qualifiant son nom avec le 
pseudo-paquetage CORE : : . 

prefixe 

Un ope'rateur qui precede son operande, 
comme dans ++$x. 

preprocesseur 

Un processus d'aide pour preparer des don- 
nees pour le processus courant. Souvent 
effectue a l'aide d'un tube. Voir aussi pre- 
processeur. 

preprocesseur C 

La premiere passe typique du compilateur 
C, qui traite les lignes qui commencent 
par un # pour compiler de maniere condi- 
tionnelle et definir les macros, et qui effec- 
tue diverses manipulations du texte du 
programme en se basant sur les defini- 
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tions courantes. Egalement connu sous le 
nom de cpp(l). 

procedure 

Un sous-programme. 

processus 

Une instance d'un programme en train de 
tourner. Sous des systemes multitaches 
comme UNIX, plusieurs processus peu- 
vent faire tourner le meme programme de 
facon independante en meme temps ; en 
fait, la fonction fork est concue pour en 
arriver a cet heureux etat de fait. Sous 
d'autres systemes d'exploitation, les pro- 
cessus sont parfois appeles « taches » ou 
« jobs » souvent avec de faibles nuances de 
signification. 

proprietaire 

L'utilisateur unique (le super-utilisateur 
mis a part) qui exerce un controle absolu 
sur un fichier. Un fichier peut egalement 
appartenir a un groupe d'utilisateurs qui 
en partagent la propriete si le proprietaire 
reel le permet. Voir bits d'autorisation. 

propriete 

Voir variable d'instance ou propriete de 
caractere. 

propriete de caractere 

Une classe de caractere predefinie retour- 
nee par le metasymbole \p. La plupart de 
ces proprietes sont definies pour Unicode. 

protocole 

En reseau, une maniere convenue 
d'envoyer et de recevoir des messages qui 
permet aux deux correspondants de ne pas 
trop se melanger les pinceaux. 

prototype 

Partie optionnelle d'une declaration de 
sous-programme indiquant au compilateur 
Perl le type et le nombre de ses parametres 
reels, qui rend les sous-programmes sem- 
blables a des fonctions predefinies. 

pseudofonction 

Une construction qui ressemble a une 
fonction mais qui n'en est pas une. Utilise 
pour les modificateurs de lvalue comme 
my, pour les modificateurs de contexte 



comme scalar, et pour les constructions 
comme q//, qq//, qx//, qw//, qr//, m//, 
s///,y///ettr//A 

pseudohachage 

Une reference a un tableau dont le pre- 
mier element contient une reference a un 
hachage. Un pseudohachage peut etre con- 
sidere comme une reference a un tableau 
ou une reference a un hachage. 

pseudo litteral 

Un operateur qui ressemble a un litteral, 
comme l'operateur d'absorption de sortie, 
' commande' . 

pumpkin 

Un hypothetique « sceptre » qui se trans- 
met d'une personne a l'autre dans la com- 
munaute Perl pour savoir qui gouverne 
tel ou tel domaine de developpement. 

PV 

Abreviation de « pointer value », qui 
signifie char* en Jargon Interne Perl. 

qualifie 

Nom defini completement defini. Le sym- 
bole $Foo: :bar est qualifie ; $bar ne Test 
pas. Un nom de fichier qualifie est le che- 
min complet depuis la racine des repertoi- 
res. 

quantificateur 

Composant d'une expression reguliere spe- 
cifiant le nombre d'occurrence d'un atome. 

quartet 

La moitie d'un octet, equivalent a un chif- 
fre hexadecimal, et qui vaut quatre bits. 

ramasse-miettes 

Une fonctionnalite de certains langages de 
programmation, qui devrait plutot s'appe- 
ler « Maman va ranger la chambre ». Ce 
n'est pas exactement ce que fait Perl, mais 
il se fie a un mecanisme de comptage de 
references pour laisser les lieux aussi pro- 
pres en sortant qu'en entrant. Cependant, 
si ca peut vous rassurer quand l'interpre- 
teur sort, un vrai ramasse-miettes est lance 
pour s'assurer que des references circulai- 
res (entre autres) ne trainent pas dans les 
coins. 
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recherche de correspondance 

Prendre un motif, exprime par une expres- 
sion reguliere, et I'essayer de diverses 
manieres sur une chaine pour voir s'il y a 
moyen de le faire correspondre. Souvent 
utilise pour extraire des informations inte- 
ressantes d'un fichier. 

reconnaissance de motif progressive 

Une reconnaissance de motif qui reprend a 
partir de la oil il s'est arrete . 

recursion 

L'art de definir un chose (au moins partiel- 
lement) en fonction d'elle-meme, ce qui 
dans un dictionnaire est absolument 
exclu, mais qui dans un programme 
d'ordinateur equivaut a une boucle infinie 
avec une condition d'arret exceptionnelle, 
en faisant attention d'atteindre un jour 
cette condition. 

reference 

Un endroit oil Ton trouve un pointeur 
vers des informations stockees ailleurs 
(voir indirection). Les references existent 
sous deux formes, references symboliques et 
references en dur. 

reference arriere 

Une sous-chaine capturee par un motif par- 
tiel entre parentheses simples, a l'interieur 
d'une regex. Les termes (\1, \2, etc.) 
memorisent une reference pour les occur- 
rences correspondantes des sous-motifs. 
Hors du motif, les variables nombres $1, 
$2, etc.) referencent les memes valeurs, 
tant que le champ dynamique du motif est 
valable. 

reference en dur 

Une valeur scalaire contenant l'adresse 
reelle d'un referent, telle que la renvoie le 
compteur de references. (Certaines referen- 
ces en dur sont contenues en interne, 
comme la reference implicite de Fun des 
emplacements de variable d'un typeglob a 
son referent correspondant). Une refe- 
rence en dur est differente d'une reference 
symbolique. 

reference soft 

Voir reference symbolique. 



reference symbolique 

Une variable dont la valeur est le nom 
d'une autre variable ou d'un sous-pro- 
gramme. Dereferencer la premiere variable 
permet d'obtenir la seconde. Les referen- 
ces symboliques sont interdites avec le 
pragma use strict 'refs'. 

referent 

Ce a quoi refere une reference, qui n'a pas 
forcement un nom. Les types de referent 
communs sont les scalaires, le tableaux, le 
hachages et les sous-programmes. 

regex 

Voir expression reguliere. 

remplacement 

Dissimuler ou invalider une autre defini- 
tion du meme nom (a ne pas confondre 
avec la surcharge, qui se contente d'ajouter 
des definitions lesquelles sont distinguees 
par un autre moyen). Comme si ce n'etait 
pas suffisant, nous employons ce mot avec 
deux definitions surchargees : pour 
decrire comment il est possible de definir 
un sous-programme personnel cachant une 
fonction interne du meme nom (voir Sup- 
planter desfonctions internes dans le chapi- 
tre 11, Modules) et pour decrire comment 
definir une methode de remplacement 
dans une classe derivee cachant la methode 
d'une classe de base du meme nom (voir le 
chapitre 12). 

repertoire 

Un endroit oil resident les fichiers et even- 
tuellement d'autres repertoires. Certains 
systemes Sexploitation peuvent le nommer 
« dossier », « drawer » (tiroir) ou 
« catalogue ». Egalement appele 
« directory » dans certains langages huma- 
noides. 

repertoire courant 

Voir repertoire de travail. 

repertoire de base 

Le repertoire dans lequel on se trouve 
quand on s'est identifie sur le systeme. Sur 
un systeme UNIX, le nom est souvent 
place dans $ENV{H0ME} ou $ENV{LOGDIR} 
par le programme de login, mais on peut 
egalement le trouver avec getp- 
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wuid($<)[7]. (Certains systemes sont 
depourvus de cette notion.) 

repertoire de travail 

Votre repertoire courant a partir duquel les 
noms de fichiers relatifs sont calcules. Le 
systeme Sexploitation le connait par la fonc- 
tion chdir ou parce que votre processus 
parent a demarre a cet endroit. 

RFC 

« Request For Comment », appel a com- 
mentaires, qui sont des series de docu- 
ments standards importants, contraire- 
ment a ce que laisse supposer leur deno- 
mination timide. 

root 

Le super-utilisateur (UID == 0). C'est aussi 
le repertoire racine du systeme de fichier. 

RTFM 

Sigle anglophone pour vous suggerer de 
bien vouloir lire le superbe manuel. 

RV 

Une Reference de Valeur interne du type 
de celle qu'un scalaire represente. Voir 
aussi IV et NV. 

rvalue 

Une valeur que Ton peut trouver du cote 
droit d'une assignation. Voir egalement lva- 
lue. 

saut de ligne 

Un caractere unique representant la fin 
d'une ligne, d'une valeur de 012 octal sous 
UNIX (mais 015 sur un Mac), et repre- 
sente par \n dans les chaines Perl. Pour les 
machines sous Windows et certains peri- 
pheriques physiques comme les termi- 
naux, il est traduit automatiquement par 
votre bibliotheque C en saut de ligne et 
retour chariot, mais normalement aucune 
traduction n'est effectuee. 

scalaire 

Une valeur simple, comme un nombre, 
une chaine ou une reference. 

script 

Un fichier texte qui est un programme a 
executer directement au lieu d'avoir a le 
compiler sous une autre forme avant Y exe- 
cution. Aussi, dans le contexte Unicode, un 



systeme d'ecriture pour un langage parti- 
culier tel le Grec, le Bengali ou le Klingon. 

script kiddie 

Un cracker qui n'est pas un hacker, mais en 
connait juste assez pour executer des 
scripts tout faits. En general, les program- 
mes qu'il ecrit sont de simples imitations 
de programmes existants. 

sed 

Un venerable editeur duquel Perl derive 
certaines idees. 

selecteur 

Une option de la ligne de commande qui 
modifie le comportement d'un pro- 
gramme, habituellement notee avec le 
signe moins. 

semaphore 

Jolie sorte de signaux mutuels qui empe- 
chent les threads ou les processus d'utiliser 
les memes ressources simultanement. 

separateur 

Un caractere ou une chaine qui separe deux 
chaines entre elles. La fonction split fonc- 
tionne sur les separateurs. A ne pas con- 
fondre avec les delimiteurs ou les 
terminateurs. Le « ou » de la premiere 
phrase separe deux alternatives. 

sequence d'echappement 

Voir metasymbole. 

sequence de tri 

L'ordre dans lequel les caracteres sont tries. 
Utilise par les routines de comparaison de 
chaines pour decider, par exemple, oil 
mettre dans le glossaire « sequence de 
tri ». 

serialisation 

Mettre une structure de donnees en ordre 
lineaire de facon a pouvoir la stocker 
comme une chaine sur un fichier disque 
ou dans une base de donnees ou bien 
l'envoyer dans un tube. 

serveur 

En reseau, un processus qui peut publier 
un service ou se contenter d'attendre a un 
endroit donne que des clients ayant besoin 
d'un service se manifestent. 
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service 

Quelque chose que Ton fait a une per- 
sonne pour lui faire plaisir, comme lui 
indiquer l'heure. Sur certaines machines, 
les services les plus connus sont listes par 
la fonction getserver. 

setgid 

Comme setuid, mais concernant les privile- 
ges des groupes. 

setuid 

Un programme tournant avec les privile- 
ges de son proprietaire au lieu des privile- 
ges de Futilisateur (ce qui est en general le 
cas). Decrit aussi le bit du mot mode (flags 
de permissions) qui implemente cette 
fonctionnalite. Ce bit doit etre explicite- 
ment active par le proprietaire, et le pro- 
gramme doit etre ecrit de facon a ne pas 
donner plus de privileges que necessaire. 

shebang 

En Perl c'est la sequence # ! qui indique au 
systeme oil trouver l'interpreteur. Le 
terme vient de la construction du mot 
anglais « sharp » designant # et de 
« bang » pour ! . 

shell 

Un interpreteur de ligne de commande. Le 
programme qui donne une invite interac- 
tive, accepte une ou plusieurs lignes 
d'entree et execute les programmes men- 
tionnes, leur fournissant leurs arguments et 
leurs donnees d'entree. Les shells peuvent 
egalement executer des scripts contenant 
ces commandes. Sous le systeme d'exploita- 
tion UNIX, les shells habituels sont le 
Bourne shell (Jbin/sh), le C shell i/bin/csh) 
et le Korn shell (/bin/ksh). Perl n'est pas 
strictement un shell car il n'est pas interac- 
tif (bien que des programmes Perl puis- 
sent etre interactifs). 

signal 

Un eclair soudain ; ou plutot un evene- 
ment declenche par le systeme d'exploita- 
tion, a n'importe quel moment, de 
preference au moment oil vous ne vous y 
attendez pas. 

slurp 

Lire un fichier en entier dans une chaine 
en une operation. 



socket 

Un point de communication reseau entre 
deux processus, qui fonctionne comme un 
telephone ou une boite a lettres. La chose 
la plus importante concernant une socket 
est son adresse reseau (comme un numero 
de telephone). Des types differents de soc- 
kets ont des types d'adresse differents ; cer- 
tains ressemblent a des noms de fichiers, 
d'autres non. 

sortie standard 

Le flux de sortie par defaut d'un pro- 
gramme, qui ne doit pas se preoccuper de 
la destination des donnees. Represente 
dans un programme Perl par le handle de 
fichier STDOUT. 

sous-chaine 

Une partie d'une chaine, commencant a 
partir d'une certaine position de caractere 
(de'placement), et courant sur un certain 
nombre de caracteres. 

sous-classe 

Voir classe derivee. 

sous-motif 

Composant un motif d'une expression 
rationnelle 

sous-motif de code 

Sous-motif d'une expression rationnelle 
dont la fonction est d'executer du code 
Perl, par exemple les sous-motifs (?{...}) 
et (??{...}). 

sous-programme 

Une partie nominee d'un programme qui 
peut etre invoquee d'un autre endroit du 
programme pour atteindre un but secon- 
dare du programme. Un sous-programme 
est souvent parametre pour accomplir des 
taches differentes mais en rapport selon 
les arguments fournis en entree. Si la 
valeur que le programme retourne a une 
signification. 

standard 

Indus dans la distribution officielle de 
Perl comme module standard, outil stan- 
dard ou bien page de manuel standard. 

statique 

Variant lentement, compare a autre chose. 
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(Malheureusement, tout est relativement 
stable compare a autre chose, a part certai- 
nes particules elementaires, et encore). 
Dans les ordinateurs, oil les choses sont 
censees varier rapidement, « statique » a 
une connotation pejorative, indiquant 
une variable, une methode ou un sous-pro- 
gramme legerement defectueux. Dans la 
culture Perl, nous evitons d'utiliser ce 
mot. 

statut 

La valeur renvoyee au processus pere quand 
Tun de ses processus fils meurt. Cette 
valeur est placee dans la variable speciale 
$?. Ses huit bits de poids fort sont le statut 
de sortie du processus defunt, et ses huit 
bits de poids faible identifient le signal 
(s'il y a lieu) dont est mort le processus. 
Sur les systemes UNIX, cette valeur de sta- 
tut est la meme que le mot qui est renvoye 
par wait{2). Voir system dans le chapitre 
29. 

statut de sortie 

Voir statut. 

STDERR 

Voir erreur standard. 

STDIN 

Voir entree standard. 

STDIO 

Voir E/S standard. 

STDOUT 

Voir sortie standard. 

struct 

Un mot-clef C presentant une definition 
ou un nom de structure. 

structure 

Voir structure de donnees. 

structure de donnee 

La facon dont les donnees s'articulent 
entre elles et la forme qu'elles constituent 
ensemble, comme par exemple un arbre 
de forme triangulaire ou une table rectan- 
gulaire. 



structure stat 

Un endroit special dans lequel Perl garde 
1'information sur le dernier fichier con- 
suite. 

substitution 

Pour changer des parties de chaine avec 
Poperateur si 1 1 . Ne pas confondre avec 
['interpolation de variable. 

sucre syntaxique 

Facon differente d'ecrire quelque chose : 
raccourci. 

superclasse 

Voir classe de base. 

super-utilisateur 

La personne a qui le systeme d'exploitation 
laisse faire presque tout ce qu'il veut. Typi- 
quement, l'administrateur systeme, ou 
quelqu'un pretendant l'etre. Sur un sys- 
teme UNIX, l'utilisateur root. Sur les syste- 
mes Windows c'est l'administrateur. 

surcharge 

Donner une nouvelle signification a un 
symbole ou a une construction. En fait, 
tous les langages pratiquent la surcharge a 
un degre ou un autre, car les gens savent 
distinguer les significations d'apres le con- 
texte. 

surcharge d'operateur 

Un type de surcharge que Ton peut effec- 
tuer sur les ope'rateurs internes pour les 
faire fonctionner (de maniere syntaxique) 
sur des objets comme s'il s'agissait des 
valeurs scalaires ordinaires, mais les regies 
semantiques etant fournies par la classe. 
Ceci est active par le pragma de surcharge- 
voir le chapitre 13. 

SV 

Abreviation de « scalar value ». Mais dans 
l'interpreteur Perl, tout referent est traite 
comme une sorte de SV, d'une certaine 
maniere orientee objet. Toute valeur dans 
Perl est passee en tant que pointeur SV* en 
C. La struct SV connait son propre type 
de referent, et le code est assez intelligent 
(esperons-le) pour ne pas essayer d'appeler 
une fonction de hachage sur un sous-pro- 
gramme. 
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symbole 

En general, un token ou un metasymbole. 
Souvent utilise pour designer les noms 
que Ton trouve dans une table de symboles. 

synchrone 

Sequence d'evennements dont l'ordre 
d'arrivee est determine. 

syntaxe 

Du grec « avec-arrangement ». Comment 
des elements (en particulier des symboles) 
sont assembles entre eux. 

systeme d'exploitation 

Un programme special qui tourne sur la 
machine elle-meme et cache les details bas 
niveau de gestion des processus et des peri- 
pheriques. Egalement utilise dans un sens 
plus general pour indiquer une culture de 
programmation particuliere. Le sens gene- 
ral peut etre employe a divers degres de 
specificite. a un extreme, on peut dire que 
toutes les versions d'UNIX et de ses clones 
sont le meme systeme d'exploitation (ce 
qui enerve beaucoup de gens, surtout les 
avocats). A l'autre extreme, une version 
donnee du systeme d'exploitation d'un 
fournisseur donne differe de n'importe 
quelle autre version de ce fournisseur ou 
d'un autre. Perl est beaucoup plus porta- 
ble entre les systemes d'exploitation que 
de nombreux autres langages. Voir egale- 
ment architecture et plateforme. 

systeme de fichiers 

Un ensemble de repertoires et de fichiers 
residant sur une partie du disque. Aussi 
appele « partition ». Vous pouvez changer 
le nom d'un fichier ou bien le deplacer 
dans l'arborescence du systeme sans depla- 
cer le fichier lui-meme, du moins sur le 
systeme UNIX. 

table de hachage 

Une methode utilisee en interne par Perl 
pour implementer les tableaux associatifs 
(hachages) de maniere efficace. 

table de symboles 

La oil un compilateur conserve ses symbo- 
les. Un programme comme Perl doit, 
d'une maniere ou d'une autre, se souvenir 
de tous les noms de variables, de handles de 



fichiers et de sous-programmes qu'il a utilise. 
II place a cet effet les noms dans une table 
de symboles, qui est implemented en Perl 
par une table de hachage. II existe une table 
de symboles separee pour chaque paque- 
tage, qui donne a chaque paquetage son 
propre espace de noms. 

tableau 

Sequence de valeurs ordonnees de facon a 
pouvoir y acceder par indice entier qui indi- 
que la valeur du deplacement. 

tableau associatif 

Voir hash, svp. 

tableau multidimensionnel 

Un tableau avec plusieurs indices pour 
trouver un element donne. Perl utilise des 
references a cet effet ; voir le chapitre 9, 
Structures de donnees. 

tampon 

Un lieu de stockage temporaire des don- 
nees. Le tamponnage par bloc signifie que 
les donnees sont passees a leur destination 
quand le tampon est plein. Le tamponnage 
par ligne signifie qu'elles sont passees cha- 
que fois qu'une ligne complete est recue. 
Le tamponnage de commandes signifie 
qu'elles sont passees apres chaque com- 
mande print (ou equivalente). Si la sortie 
n'est pas bufferisee, le systeme precede 
octet par octet sans utilisation d'une zone 
temporaire, ce qui est moins efficace. 

tampon par bloc 

Une methode efficiente de tamponnage 
d'entrees/sorties qui utilise un bloc de don- 
nees d'un coup. Perl l'utlise par defaut 
pour Faeces au fichiers sur le disque. Voir 
tampon et tampon de commande. 

tampon par commande 

Un mecanisme en Perl qui vous permet de 
stocker la sortie d'une commande, et la 
vide immediatement dans la meme 
requete au systeme d'exploitation. II est 
active en positionnant la variable $| 
($AUTOFLUSH) k une valeur vraie. C'est uti- 
lise lorsque vous ne souhaitez pas que vos 
donnees soient la sans rien faire a attendre 
l'ordre du depart, ce qui peut se produire 
car, par defaut, un fichier ou un tube utili- 
sent un tampon par bloc. 
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tamponnage de ligne 

Utilise par un flux d'E/S standard de sortie 
qui vide (flush) ses tampons (buffers) apres 
chaque saut de ligne. De nombreuses 
bibliotheques d'E/S standard activent ainsi 
automatiquement la sortie allant au ter- 
minal. 

TCP 

Abreviation de « Transmission Control 
Protocol ». Un protocole au-dessus de IP, 
faisant apparaitre un mecanisme de trans- 
mission de paquets non fiable comme un 
flux d'octets fiable (enfin, en theorie). 

terme 

Court-circuit pour « terminal » c'est-a-dire 
la feuille d'un arbre syntaxique, et qui a le 
role d'un operande pour les operateurs de 
l'expression. 

terminateur 

Un caractere ou une chaine qui indique la 
fin d'une autre chaine. La variable $/ con- 
tient la chaine qui termine l'operation 
readline, ce que la fonction chomp enleve 
de la fin. a ne pas confondre avec les deli- 
miteurs ou les separateurs. Le point a la fin 
de cette phrase est un terminateur. 

ternaire 

Un operateur prenant trois operandes. 

test de la sous-classe vide 

Le fait qu'une classe derivee vide doit se 
comporter exactement comme sa classe de 
base. 

texte 

Normalement, une chaine ou un fichier 
contenant des caracteres imprimables. 

thread 

Comme un processus dedouble, mais sans 
la protection memoire de l'instruction 
fork. Un thread est plus leger, au sens que 
les threads peuvent etre executes ensem- 
ble a l'interieur du meme processus en se 
disputant la meme memoire, a moins de 
prendre des precautions pour les isoler les 
uns des autres. Voir le chapitre 17, Threads. 

tie 

Le lien entre une variable magique et sa 
classe d'implementation. Voir la fonction 



tie au chapitre 29 et au chapitre 14, Varia- 
bles liees. 

TMTOWTDI 

« There's More Than One Way To Do It », 
la devise Perl. L'idee qu'il peut y avoir plu- 
sieurs facons de proceder pour resoudre 
un probleme de programmation. (Cela ne 
veut pas dire que le fait d'avoir plusieurs 
possibilites est toujours une bonne chose, 
ouque toutes les possibilites sont aussi 
bonnes les unes que les autres. Cela veut 
juste dire qu'il n'y a pas de verite unique. 

token 

Un morpheme en langage de programma- 
tion : la plus petite unite de texte qui pos- 
sede un sens. 

tokenisation 

Eclater un programme en mots et en sym- 
boles separes, chacun etant appele un 
token (symbole). Egalement appele 
« lexicaliser » , auquel cas Ton obtient des 
« lexemes » . 

tokeniseur 

Un module qui separe le programme en 
sequences de tokens pour I'analyseur syn- 
taxique. 

traitement d'exception 

La maniere dont un programme reagit a 
une erreur. Le mecanisme de traitement 
d'exception de Perl est la construction 
eval. 

tranche 

Une partie des elements d'une liste, d'un 
tableau ou d'un hachage. 

translitteration 

Transformation d'une chaine vers une 
autre par correspondance de chaque carac- 
tere vers un autre avec une fonction. Voir 
1'operateur tr/// dans le chapitre 5. 

transtypage 

Conversion explicite de donnees d'un type 
a l'autre. C autorise ceci. Perl n'en a pas 
besoin. Et n'en veut pas. 

troff 

Un langage de mise en forme duquel Perl 
derive sa variable $% secretement utilise 
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dans la production des livres de la serie du 
Chameau. 

tronquer 

Vider un fichier de son contenu, soit auto- 
matiquement en l'ouvrant pour ecriture 
ou explicitement par la fonction truncate. 

true 

Toute valeur scalaire qui ne vaut pas pas 0 
ou "" s'evalue a true dans un contexte 
booleen. 

tube 

Une connexion directe entre l'entree d'un 
processus et la sortie d'un autre sans fichier 
intermediaire. Une fois qu'il est initialise, 
les deux processus concernes peuvent lire 
et ecrire dessus comme si c'etait un fichier 
banal, avec quelques precautions. 

tube nomme 

Un tube avec un nom encapsule dans le 
systeme de fichiers de facon a pouvoir etre 
utilise comme un fichier par le processus 
lecteur, ce qui rend la programmation 
independante des donnees sources car il 
suffit de considerer la source comme un 
fichier. 

type 

Voir type de donnees et classe. 

type de donnees 

Un ensemble de valeurs possibles, avec 
toutes les operations qui savent les gerer. 
Par exemple, un type de donnees numeri- 
que comprend un certain ensemble de 
valeurs sur lesquelles il est possible de tra- 
vailler, ainsi que diverses operations 
mathematiques associees qui n'auraient 
que peu de sens sur, par exemple, une 
chaine comme « argh » . Les chaines ont 
leurs operations propres, comme la conca- 
tenation. Les types composes d'un certain 
nombre d'elements plus petits ont genera- 
lement des operations permettant de les 
composer et de les decomposer, et peut- 
etre de les rearranges Les objets qui mode- 
lisent les choses du monde reel ont sou- 
vent des operations qui correspondent a 
des activites reelles. Par exemple, si Ton 
modelise un ascenseur, l'objet en question 
peut avoir une methode ouvrir_porte(). 



typedef 

La definition d'un type en langage C. 
typeglob 

Emploi d'un identificateur unique (par 
exemple *nom) pour designer $nom, @nom, 
%nom, Snom ou simplement nom. Son mode 
d'utilisation determine s'il est interprets 
comme tous ces derniers, ou comme un 
seul d'entre eux. Voir Typeglobs et handles 
de fichiers dans le chapitre 2. 

typemap 

Dans un module extension ecrit en XS 
decrit comment transformer un type C 
vers un type Perl ou reciproquement. 

UDP 

« User Datagram Protocol », la facon typi- 
que d'envoyer des datagrammes sur inter- 
net. 

UID 

Un identifiant d'utilisateur. Souvent 
employe dans le contexte de la propriete 
d'un fichier ou d'un processus. 

umask 

Le masque de bits d'autorisation pour creer 
des fichiers ou des repertoires pour deter- 
miner a qui vous en refusez faeces. Voir la 
fonction umask. 

Unicode 

Un ensemble de caracteres qui contient 
tous les caracteres du monde, plus ou 
moins. Voir http://www.unicode.org. 

unite de compilation 

Le fichier (ou la chaine dans le cas d'un 
eval) dans le processus de compilation cou- 
rant. 

Unix 

Un grand langage en constante evolution 
avec plusieurs syntaxes largement incom- 
patibles, avec lequel n'importe qui peut 
definir n'importe quoi n'importe com- 
ment, ce dont peu se privent. Les UNIXo- 
phones le croient facile a apprendre car on 
peut facilement le tordre a sa convenance, 
mais les differences entre les dialectes ren- 
dent les communications intertribales 
quasiment impossibles, et les voyageurs en 
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sont souvent reduits a utiliser une version 
petit-negre du langage. Pour etre univer- 
sellement compris, un programmeur shell 
UNIX doit etudier son art pendant des 
annees. Nombreux sont ceux qui ont 
abandonne cette discipline et communi- 
quent a present via une sorte d'esperanto 
appele Perl. Dans les temps anciens, UNIX 
representait egalement du code que quel- 
ques personnes des Bell Labs avaient ecrit 
pour utiliser un ordinateur PDP-7 qui ne 
faisait rien d'autre a ce moment-la. 

v-chaine 

Une chaine « vecteur » ou « version » spe- 
cified avec v suivie par une serie d'entiers 
decimaux en notation pointee, par exem- 
ple, vl. 20. 300. 4000. Chaque nombre 
devient un caractere avec sa valeur ordi- 
nate. (Le v est optionel quand il y a au 
moins trois caracteres.) 

valeur 

Une donnee reelle, par constraste avec les 
variables, references, clefs, index, opera- 
teurs ou toute chose pour acceder a une 
valeur. 

valeur de liste 

Une liste sans nom de valeurs scalaires 
temporaires qui peuvent etre passees dans 
un programme par une fonction ren- 
voyant une liste a une expression qui four- 
nit un contexte de liste. 

valeur de retour 

La valeur produite par un sous-programme 
ou une expression a revaluation. En Perl, 
une valeur de retour doit etre soit une 
liste, soit un scalaire. 

valeur scalaire 

Une valeur qui se trouve etre scalaire par 
opposition a une liste. 

variable 

Un emplacement de memoire qui porte 
un nom et qui peut contenir diverses 
valeurs, quand votre programme en res- 
sent le besoin. 

variable d'environnement 

Mecanisme par lequel un agent de haut 
niveau, tel un utilisateur, peut transmettre 



I'etat de ses variables de travail a un proces- 
sus fils. Chaque variable d'environnement 
a la forme d'une paire clef/valeur comme 
dans un hachage. 

variable d'instance 

Vattribut d'un objet ; donnee memorisee 
par l'instance de Pobjet et non par la classe 
entiere. 

variable lexicale 

Une variable ayant une portee lexicale, 
declaree par my. Souvent juste appele une 
« lexicale ». (La declaration our declare un 
nom a portee lexicale pour une variable 
globale, qui n'est pas une variable lexi- 
cale.) 

variable scalaire 

Une variable prefixee par un $, contenant 
une valeur unique. 

variables magiques 

Variables speciales donnant des effets 
secondaires quand on y accede en lecture 
ou en ecriture. Par exemple, en Perl, la 
modification des elements du hachage 
%ENV modifie egalement les variables 
d'environnement correspondantes que les 
sous-processus utilisent. La lecture de la 
variable $! donne le numero ou le mes- 
sage d'erreur UNIX courant. 

variable statique 

Rien de tel. Utilisez plutot une variable 
lexicale pour une portee plus grande que 
votre sous-programme. 

variadique 

Se dit d'une fonction qui recoit avec bon- 
heur un nombre indetermine d'arguments 
reels. 

vecteur 

Jargon mathematique pour designer une 
liste de valeurs scalaires. 

vidage 

Le vidage d'un tampon, souvent avant qu'il 
ne soit rempli. 

virtuel 

Ce qui donne l'illusion de quelque chose 
qui n'a pas d'existence reelle comme par 
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exemple la memoire virtuelle qui simule 
la memoire reelle (voir aussi memoire). Le 
mot inverse est « transparent » qui donne 
une existence reelle a quelque chose qui 
n'apparait pas comme la facon dont Perl 
gere l'encodage variable UTF-8. 

WYSIWYG 

« What You See Is What You Get » (Vous 
obtenez ce que vous voulez). Utilise pour 
indiquer quelque chose qui s'affiche 
comme il est ecrit, comme par exemple les 
declarations Perl format. C'est aussi le con- 
traire de la magie parce que chaque chose 
apparait comme elle est reellement, 
comme dans la fonction open a 3 argu- 
ments. 

XS 

external Subroutine, extraordinairement 
exportee, expeditivement excellente, 
expressement executee en C ou C++ exis- 
tant, ou dans un nouveau et excitant lan- 
gage d'extension appele (de facon 



exasperante) XS. Examinez le chapitre 21, 
Me'canismes internes et acces externes, pour 
une explication exacte. 

XSUB 

Un sous-programme externe defini dans XS. 
yacc 

« Yet Another Compiler Compiler ». Un 
generateur d'analyseur syntaxique sans 
lequel Perl n'aurait pas existe. Voir le 
fichier perly.y dans le source de la distribu- 
tion Perl. 

zombie 

Un processus qui est mort mais dont le 
pere n'a pas ete informe par la fonction 
wait ou waitpid. Si vous utilisez fork, 
vous devez ensuite nettoyer la memoire 
avant de sortir sinon la table des processus 
va se remplir et risque de deborder ce qui 
risque de facher l'administrateur systeme. 
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Symboles 

! (point d'exclamation) 

! (negation logique), operateur 80 

surcharge 324 
!!, commande du debogueur 484 
!= (different de), operateur 88, 554 
!~, operateur de lien 81 

utilisation avec les operateurs de 
recherche de motif 127 
dans les commandes du debogueur 484 
operateur (different de) != 24 
utilisation pour complementer les jeux de 

caracteres 156 
" (doubles apostrophes) 51, 127, 242 
chaines, utilisation dans 7 
dans la chaine de remplacement 135 
dans les arguments de formline 680 
interpolation des variables 6 
operateur de conversion en chaine 323 
traitement des sequences d'echappement de 

conversion 173 
voir aussi qq// et la fonction print 
# (diese) 

#! (shebang), notation 16, 456 

problemes de securite causes par 537 

simuler sur les systemes non-Unix 458 
dans les formats 214 
les caracteres proteges, l'espace et 55 
pour les commentaires 43 

utilisation avec le modificateur de motif 
/x 131 
$ (dollar) 11 

$! ($ERRNO, $OS_ERROR) 24, 591, 635 
$" ($LIST_SEPARATOR) 634 



$# 

prefixe pour obtenir le dernier index 65 
variable obsolete pour l'impression des 
nombres 623 

$$ ($PROCESS_ID) 47, 638 

$% ($FORMAT_PAGE_NUMBER) 216, 
630 

$& ($MATCH) 129, 130, 166, 561, 635 
$( ($REAL_GROUP_ID) 638 
$) ($EFFECTIVE_GROUP_ID) 626, 638 
$* 623 

$+ ($LAST_PAREN_MATCH) 166, 634 
$, ($OUTPUT_FIELD_SEPARATOR) 636 
$- ($FORMAT_LINES_LEFT) 216, 218, 629 
$. ($INPUT_LINE_NUMBER) 90, 631 

remise a zero avec la fonction close 658 
$/ ($INPUT_RECORD_SEPARATOR) 460, 

632 

$: 

($FORMAT_LINE_BREAK_CHARACT 

ERS) 214, 629 
$; ($SUBSCRIPT_SEPARATOR) 67, 640 
$< ($REAL_USER_ID) 638 
$= ($FORMAT_LINES_PER_PAGE) 216, 

629 

$> ($EFFECTIVE_USER_ID) 627 
$? ($CHILD_ERROR) 47, 625 

fonction close et 658 

operateur backtick et 68 
$@ ($EVAL_ERROR) 627 
$[ (index du premier element d'un 

tableau) 623 
$[, variable 623 
$\ 

($OUTPUT_RECORD_SEPARATOR) 
465, 636 
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$] ($OLD_PERL_VERSION) 635 
$ A ($FORMAT_TOP_NAME) 216, 218, 555, 
630 

$ A A ($ACCUMULATOR) 219, 624 

formline, sortie 680 
$ A C ($COMPILING) 626 
$ A D ($DEBUGGING) 462, 626 
$ A E ($EXTENDED_OS_ERROR) 629 
$ A F ($SYSTEM_FD_MAX) 395, 641, 677 
$ A H (indication pour le parser Perl) 630 
$ A I ($INPLACE_EDIT) 631 
$ A L ($FORMAT_FORMFEED) 216, 629 
$ A M (espace memoire) 634 
$ a O ($OSNAME) 587, 635 
$ A P ($PERLDB) 637 
$ A S 

($EXCEPTIONS_BEING_CAUGHT) 6 
28 

$ A T ($BASETIME) 87,625 
$ A V ($PERL_VERSION) 637 
$ A W ($WARNING) 121,641 
$ A X ($EXECUTABLE_NAME) 628 
$_ ($ARG), variable 624 

grep, fonction et 692 

instructions foreach et 103 

map, fonction et 702 
$ v ($PRE MATCH) 129, 166 
${ A (noms de variables internes) 47 
${ A WARNING_BITS} 641 
${ A WIDE_SYSTEM_CALLS} 375, 641 
$| ($OUTPUT_AUTOFLUSH) 216, 555, 636 
$~ ($FORMAT_NAME) 216, 555, 630 
$' ($PREMATCH) 561 
$' ($POSTMATCH) 129, 130, 166, 561, 637 
$' ($PREMATCH) 637 
$0 ($PROGRAM_NAME) 638 
$1 et cie. 623 

$a et $b (variables de sort) 624 
$line 28 

caractere de prototype 206 

dans le debogueur 477 

dans les noms de variables scalaires 45 

dans les recherches, assertion de fin de 

ligne 134, 161 
dereferencement avec 230 
interpolation des variables scalaires 53 
metacaractere 125, 141 
operateur $_ ($ARG) 

operateur d'angle 69 
pour les noms de variables scalaires 5, 9 
variable $_ ($ARG) 32, 34 

fonction glob avec 72 
% (pourcent) 84 

%=, operateur affectation de modulo 93 
caractere de prototype 206 



dans les noms de hachage 9 
operateur modulo 82 
pour les sommes de controle 777 
typage des variables 6 
& (esperluette) 84 

&&, operateur et logique 23, 89, 289 
&&=, operateur logique et affectation 93 
&, operateur et sur les bits 88 
&=, operateur sur les bits et affectation 93 
adresse-de, operateur (en C) 96 
caractere de prototype 206 
dans les noms de fichiers 712 
Perl version 5, changement dans 

l'utilisation 14 
pour les noms de sous-programme 6, 46, 47, 
112, 198 

dans les prototypes 205 
() (parentheses) 11, 77, 555, 571 
(...) groupement 142 
comme caracteres de protection 63 
dans les appels de sous-programme 198, 211 
dans les fonctions 643 
equilibrage 193 

inserer automatiquement avec Deparse 450 
listes nulles, representation 63 
metacaractere 125, 141 
notation (?:PATTERN), regroupement sans 

capture 167 
pour la capture dans des motifs 126, 129, 

135 

pour les references arrieres 36, 164, 166 

pour les valeurs de listes 62 

regroupement, operateur de 181 

utilisation avec l'operateur conditionnel 92 
* (asterisque) 84 

**, operateur d'exponentiation 80 

**=, operateur d'exponentiation et 
d'affectation 93 

*=, operateur de multiplication et 
d'affectation 93 

*? quantificateur 142 

caractere de prototype 206 

metacaractere 125, 141 

operateur de dereferencement (en C) 96 

operateur multiplicatif 78, 82 

pour les noms de typeglobs 6, 47, 67 

quantificateur 34, 142, 159 
+ (signe plus) 84 

++, operateur d'auto-incrementation 22, 79 

+, operateur unaire 77, 81 

+=, operateur d'addition et d'affectation 93 

+?, quantificateur 142 

dans les noms de fichiers 709 

metacaractere 125, 141 

operateur additif 83 
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qualificateurs 32 
quantificateur 142, 159 
, (virgule) 

$, variable 636 

dans les rapports avec print 636 
erreur dans les instructions print 554 
grands nombres et 51 
operateur 94 

contexte scalaire 560 

voir aussi => operator 
paires clef/valeur et 11 
paires clefs/valeurs et 65 
precedence 78, 115 
separateur 11 

separation des valeurs d'une liste 62, 63 
utilisation dans les declarations de 
boucle 102 
-(tiret) 84, 181 

-*- pour emacs 457 

- - , operateur d'autodecrementation 22, 79 

- - , option de la ligne de commande 460 
-=, operateur de soustraction et 

affectation 93 
->, operateur fleche 79, 231 

appels de methode et 287 

dereferencement de references avec 79 
dans les commandes du debogueur 482 
dans les intervalles de caracteres 148 
operateur arithmetique de negation 80 
operateur de soustraction 83 
soustraction de jeu de caracteres 156 
. (point) 84 

.., operateur d'intervalle 90 
operateur d'intervalle 90 
.=, operateur de concatenation et 

affectation 93 
caractere joker 131,147 
caracteres speciaux 33 
dans@lNC 805 
dans des motifs 181 
dans les classes de caracteres 157 
glober des fichiers et 689 
metacaractere 125, 141 
operateur (concatenation) 20 
operateur de concatenation 83, 565 

autogeneration par le handler de 
conversion en chaine 324 
quantificateurs, utilisation dans les 33 
separation des entiers avec les v-chaines 58 
vecteurs (adresses IP) 683 
/(slash) 84 

//, voir mil, operateur 
/=, operateur de division et affectation 93 
commande du debogueur 483 
delimiteurs, remplacement comme 54 



operateur de division 82 

repertoire racine 657 
: (deux-points) 

:: dans les noms absolus 47 

:: dans les noms de module, traduction en 
separateurs de repertoire 276 

:: pour identifier un paquetage 56, 267, 558 

dans les declarations de sous- 
programme 210, 211 

dans les etiquettes 101 

dans les groupes de motif 168 

dans les listes d'importation d'un 
module 628 

dans les XSUB 502 

sauts de lignes dans les formats avec $: 629 
; (point-virgule) 

dans les commandes du debogueur 478 
dans les noms de fichiers, risques de securite 

des 534 
erreurs, oublier a la fin 554 
fin des instructions simples 43, 97 
< (inferieur) 

<, operateur (inferieur) 18, 24, 87 

«, operateur de decalage a gauche 83, 954 

«, operateur de lecture de ligne 

voir operateur angle 
«, pour documents « ici-meme » 56 
«=, operateur de decalage et affectation 93 
<=, operateur (inferieur ou egal a) 24, 87 
<=>, operateur de comparaison 24, 88, 747 
<>, operateur de lecture de ligne 

voir operateur angle 
dans les commandes du debogueur 484 
dans les noms de fichiers 709 
pour globaliser les noms de fichiers avec 

<> 71 

pour la justification a gauche 217 

<> 

dans un contexte de liste 70 
= (egal) 

==, operateur egal a 21, 24, 88, 554 
==>, marqueur de ligne courante 477 
=> (associatif) operateur 11 
=>, operateur de correspondance 66, 95 

parametres nommes et 66 
=~, operateur de liaison de motif 32, 81 

utilisation avec les operateurs de 
recherche de motif 127 
commande du debogueur 485 
dans les directives pod 596 
operateur d' affectation 6 
> (superieur) 

<> operateur lecture de ligne 

voir operateur lecture de ligne 
>, operateur (superieur) 18, 24, 87 
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>=, operateur superieur ou egal 24, 87 
», operateur de decalage a droite 83 
»=, operateur de decalage et affectation 93 
dans les commandes du debogueur 484 
dans les noms de fichiers 709 
pour globaliser les noms de fichiers 71 
pour la justification a droite 217 
? (point d'interrogation) 84 

?, quantificateur 34, 142, 166 
?:, operateur conditionnel 91, 110 
??, quantificateur 142, 166 
metacaractere 125, 141 
? (point d'interrogation) extensions de regex 
(?!) 183 
(?<!) 184 
(?<=) 184 
(?=) 183 
(?>) 185 
@ (arobase) 

@+ (@LAST_MATCH_END) tableau de 

positions finales 166 
@+ (@LAST_MATCH_END) tableau des 

positions des fins 633 
@- (@LAST_MATCH_START) tableau de 

positions initiales 166 
@- (@LAST_MATCH_START) tableau des 

positions des debuts 633 
@_ (@ARG), tableau 199, 625 
a l'interieur des chaines, echappement et 

caractere antislash 53 
caractere de prototype 206 
dans le debogueur 477 
dans les lignes images 214 
modifications entre les versions de Perl 558 
pour les noms de tableaux 5, 45 
[] (crochets) 

[, metacaractere 125, 141 

\C pour de PUnicode et 378 

composeur de tableaux 224 

et \p, \P pour de l'Unicode 378 

et \X pour de l'Unicode et 378 

pour detecter des caracteres 181 

pour les classes de caracteres 32, 142, 145, 

148 

precedence 77 
tableaux et 9, 11 
\ (antislash) 51, 728 

\\ doubles guillemets, interpretation avec 6 
chaines protegees, eviter la surcharge dans 
les 54 

comme caractere d'echappement 52 

en tant que separateur de repertoires sur MS- 

SDOS 848 
entrer des commandes continues dans le 

debogueur 478 



interpretation par Panalyseur de regex 172 
la notation \Q pour prefixer tous les 

caracteres non alphanumeriques 53 
operateur de reference 81, 223, 235 
pour des commandes du debogueur 

multilignes 476 
pour faire des metasequences de caracteres 

simples 124 
pour les metacaracteres 125, 142 
pour proteger des caracteres 124, 141 
references arrieres et 36 
\d (pour digit, chiffre) 32 
A (chapeau) 

A =, operateur xor sur les bits et 

affectation 93 
assertion de debut de ligne 34, 35, 161 
comportement specifique, l'eviter dans un 

motif 148 
dans la detection 181 

assertion de fin de ligne 134 
inversion de classe de caractere 148 
metacaractere 125, 141 
operateur ou-exclusif sur les bits 88 
pour le texte inclus dans les formats 214 
_ (souligne) 

dans les identificateurs 42, 47 
dans les noms de variable 268, 572 
double 59 

fields, pragma, utilisation dans 801 
grands nombres et 51 
handle de fichier global 623 
marquage et 530 

modifications entre les versions de Perl 558 
{} (accolades) 242, 554, 570 

{, metacaractere 125, 141 

blocs simples, creer avec des 108 

composeur de hachages 225 

dans les chaines 268 

dans les commandes du debogueur 484 

dans les formats 214 

flecheset 232 

hachage vs. tableaux 11 

identificateurs dans les 53 

identificateurs entre 53 

indiquer une clef entre 11 

motifs de recherche, eclaircir l'utilisation 56 

pour les blocs d'instructions 27, 43, 99 

pour Unicode 147, 377 

precedence 77 

quantificateur 33, 142 
| (barre verticale) 

...|... alternative 126, 142, 168 

|- recevoir/envoyer une pseudo-commande 
via un pipe 400 

|=, operateur ou sur les bits 93 
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||, commande du debogueur 484 
||, operateur ou logique 89, 170, 289 

precedence face a chdir 78 
||=, operateur logique et d'affectation 93 
commande du debogueur 484 
dans les noms de fichiers 709 
metacaractere 125, 141 
operateur ou sur les bits 88 
pour le centrage 217 
~ (tilde) 

expansion du repertoire maison 689 
operateur de negation sur les bits 80 
pour supprimer les lignes blanches 215 
' (apostrophe inverse) 51, 54, 399 
contexte vide et 571 
execution de commande 68 
exemple d'utilisation 7 
inhiber ['interpolation des variables 6 
operateur 61,558,571 
portabilite de 592 
securite et 535 

supprimer Finterpolation des variables 54 
' (apostrophe) 

inhiber le traitement des sequences 

d'echappement de conversion 173 
qxet 728 

Nombres 

0 but true 676 

exemption de -w 675 
0+ (numification) operateur 323 
-0, option de la ligne de commande 456, 460 
32-bits, systemes 589 
64-bits, systemes 589 



\a (alerte ou bip) 52 

-a (autosplit), option de la ligne de 

commande 461, 629 
-A (date d'acces) operateur de test de fichier 86, 

87, 625 
\A (limite de chaine) 161 
abbreviations, texte 820 
abs (valeur absolue), fonction 648 

complexes, nombres et 857 

surcharge 326 
abstraction 265 

en programmation orientee objet 285 
accent grave 

voir apostrophe inverse dans les symboles 
accept, fonction 

dans les serveurs preforkes 393 

defined 648 

exemple d'utilisation 412, 413, 855 
portabilite de 588 



signaux et 388 

utilisation avec connect 659 

utilisation avec le module FileHandle 767 

acces 

date pour un fichier 758, 780 

elements de tableaux lies 345 

enregistrements de structures de donnees 
elaborees 260 

hachages de tableaux 253 

hachages multidimensionnels 257 

methodes supplantees 297 

tableau de hachages 255 

tableaux multidimensionnels 248 

tranches de tableaux 

multidimensionnels 248 
acces aux donnees, threads 425-433 

deadlock 427 

deverrouiller 427 

variables de condition 430 

verrou mortel 427 

verrouiller des methodes 429 

verrouiller des sous-programmes 428 
accolades ({}) 

voir accolades dans les symboles 
$ACCUMULATOR 624 
actions (debogueur) 

execution de commandes, specifier depuis le 
debogueur 483 

lister toutes 481 
ActiveState, distribution de Perl 

installer sur les systemes Windows 458 

Microsoft, modules uniquement pour 830 

PPM (Perl Package Manager) 520 
addition 20 

operateur plus (+) surcharge 321 
adressage de tableau 

negatif 44 
adresse-de, operateur (en C) 96 
adresses 

empaquetees de sockets 689 

en langage C ou en Perl 557 

noms de sockets comme 650 

obtenir depuis des noms d'hotes 685 

reseau, convertir en noms 682, 683, 684 

reutilisees, afficher le contenu des 490 
affectation 

a l'operateur conditionnel ?: 93 

aux listes 64 

de variables liees 341 

element de tableau lie 346 

elements de tableaux a deux 
dimensions 247 
affectation, operateurs d' 93 

precedence des, modifications entre les 
versions de Perl 559 



986 



Index 



surcharge 325 

voir aussi constructeur de copie 
affichage 

hachages de tableaux 253 

hachages multidimensionnels 257, 260 

tableaux de hachages 255 

tableaux multidimensionnels 248, 252, 255 
afficher 

typeglob, contenu d'un 490 
affirmative de prevision, assertion 180, 183 
AFN (automate fini non deterministe) 178 
ajouter 

des chaines a des chaines avec .= 93 

des elements a des tableaux 247, 777 

des membres a un hachage existant 255 

elements a des tableaux 727 
.al, fichiers se terminant avec 274 
alarm, fonction 649 

associer avec sleep 746 

delai limite pour les correspondances de 
motifs 551 

portability de 588 
aleatoires, nombres 728, 757 
algorithmes 947 

modules Perl pour les 517 
alias 947 

commande du debogueur pour les 485 
d'une table de symbole 68 
dans la table des symboles 48 
dans les boucles for/foreach 104 

rechercher et remplacer des elements 
dans des tableaux 137 
en affectant a un typeglob 270 
pour des caracteres 146 
ALRM, signal 
defini 389 

exemple d'utilisation 384 
alternance 947 
alternatives 126 

classes de caracteres et 149 

dans des motifs 168 

detecte l'un ou l'autre (...|...) 142 

interne, limitation de la portee de 167 

precedence, recherche de motif 179 
American Standard Code for Information 

Interchange 

voir ASCII 

amorcer (bootstrapping) des modules 503, 828 
analyse 

interpolation en guillemets doubles et 
expressions rationnelles 127 
analyse de texte 

modules Perl pour 1' 518 
analyse lexicale 947 
analyse syntaxique 500 

dans le compilateur Perl 438 



ancres 35, 161 

and (&&), operateur logique 572 
angle 

voir operateur d' angle 
anonyme 947 

composeur de hachages 225 
composeur de sous-programme 226 
composeur de tableaux 224 
hachages 

ajout a des hachages 

multidimensionnels 256 
structure de donnees pour objets 291 
tableau de, creation 254 
pipes 398-399 
referents 222 
sous-programmes 197 

donner un nom a Pexecution 271 
tableaux 

creation d'un hachage de 252 
tranche de tableau a deux 
dimensions 249 
AnyDBM_File, module 824 
Apache, serveur web 507 

CGI::Apache, module 824 
mod_perl, extension 445 
modules Perl pour 519 
apostrophe inverse (') 

voir apostrophe inverse dans les symboles 
apostrophes (') 

comme delimiteurs de paquetage 268 
appelant 948 
appels 

indirects de sous-programme 198 

par reference 199, 203, 947 

par valeur 200, 948 
appels bloquants, verrous dans les threads 426 
appels systeme 763, 948 

en Perl ou en langage C 557 

interruption de signaux dans les 388 

relancer 389 
arbres syntaxiques 436, 439 

interne, garder en 446 

originaux, reconstruire et integrer dans 
l'arbre syntaxique actuel 448 

reconstruction des 437 
arc tangente, fonction 

voir atan2 
architecture 948 
$ARG ($_ avec use English) 624 
$ARG (terme pour $_) 69 
arguments 948 

formels 625,948 

reels 948 

voir aussi parametres 
arguments de la ligne de commande 948 
arguments de programmes, en shell ou en 

Perl 558 
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ARGV, handle de fichier 621, 625 
@ARGV, tableau 625,669 
-s, option et 467 

exemple d'utilisation 107, 140, 188, 406, 760 

marquage et 527 

pop et 724 

shift et 744 
$ARGV, variable 625, 948, 949 

en langage C ou en Perl 557 
ARGVOUT, handle de fichier 621, 625 
arite 75 

liste de la plus haute a la plus basse 76 
arrondir des nombres avec la fonction 

sprintf 694 
ASCII 41, 949 

convertir en caracteres 657 

convertir vers de l'Unicode 377 

valeurs pour les caracteres 716 

voir chr 

voir ord 

ASP 

modules Perl pour 519 
assertion \b (limite de mot) 35 
assertions (dans des motifs) 125, 142, 949 

assertions peripheriques 183 

classes de caracteres et 149 

de position 161-164 

\A et A , assertions de limite de 

chaine 161 
\b et \B, assertions (limite de mot) 162 
\G, assertion 134 
\z, \Z et $, assertions 161 

definir vos propres 194 

precedence, recherche de motif 180 
assertions de largeur nulle 125, 142, 161 

quantificateurs 126 
associatifs, tableaux 

voir hachages 
associativite des operateurs 75, 88, 949 
astronomie 

modules Perl pour 1' 520 
async, fonction (dans le module Thread) 421 
atan2 (arc tangente), fonction 

complexes, nombres et 857 

pour calculer pi 649 
atomes 180,949 

dans les recherches de motifs 181 
atomique, operation 540 
attributes, pragma 210, 792 
attributs 949 

attributes, pragma 825 

classe 

stocker l'etat de 315 

de classe 706 



de fichiers, operateurs de test pour 25 
en programmation orientee objet 293 
interpolation de variables et 716 
locked et method, utilisation avec les 

threads 315 
locked, sous-programmes 429 
lvalue, sous-programmes 314 
objets, hachage d' 12 
sous-classe, surcharge de surclasse 306 
sous-programmes 210-212 
syntaxe des noms 211 

attrs, module (obsolete) 825 

audio 

modules Perl pour 1' 520 
authentification 

modules Perl pour 1' 518, 825 
auto-incrementation (++), operateur 22, 79, 326, 

949 

magique 80 
autochargement 949 

generation d'accesseurs par 309 

methodes 301 
autodecrementation ( - - ), operateur 22, 79 

magique 325 
autodetection, de caracteres 181 
autogeneration, surcharge 324, 949 

empecher 330 
AUTOLOAD, sous-programme 112, 273-274, 

301 

utilisation avec goto 692 
AutoLoader, module 274, 827 
autorisation 

modules Perl pour 1' 518 
autosplit, mode (avec l'option -a) 461 
AutoSplit, module 274, 827 

portability de 591 
autouse, pragma 793, 827 
autovivification 79, 674, 949 

de handles de fichiers 708, 851 

de typeglobs 228, 356 

defined 232 
AV (valeur tableau interne) 500, 950 
avertissements 950 

${ A WARNING_BITS} 641 

au sujet des valeurs indefmies 97 

desactiver de maniere permanente 471 

modules pour les 827 

sur les references aux objets lies 367 

verbosite, forcer dans les 826 
avertissements lexicaux 827 

voir aussi warnings pragma 
avertissements, messages 470, 783, 871-945 
awk 30,950 

conversion en Perl 67 
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B 

-B (binaire), test de fichier 86 
\b (espace arriere, backspace), caractere 144 
dans les classes de caractere de regex 149, 
162, 181 

\B (non limite de mot), assertion 144, 162 
-b (special de type bloc), test de fichier 85 
\b, assertion de limite de mot 125, 162 

pour backspace (espace arriere) 149, 181 
B, module 829 
B::Asmdata, module 829 
B::Assembler, module 829 
B::Bblock, module 829 
B::Bytecode, module 447, 829 
B::C et B::CC, modules 448 
B::C, module 829 
B::CC, module 829 
B::Debug, module 829 
B::Deparse, module 450, 829 
B::Disassembler, module 829 
B::Lint, module 449, 829 
B::Showlex, module 829 
B::Stash, module 829 
B::Terse, module 829 
B::Xref, module 449, 829 
backends 

voir sorties 
backends (sorties), compilateur 830 
backslash (\) 

voir antislash dans les symboles 
backtick (') 

voir backtick dans les symboles 
backtracking 950 
bang (!) 

voir point d'exclamation dans les symboles 
barewords 966 
barre verticale (|) 

voir barre verticale dans les symboles 
basculer l'activation du mode trace 

(debogueur) 481 
base de registres (Microsoft Windows) 

manipuler 335 
base, classes de 826 

pour les filtres et les traducteurs de pod 827 

UNIVERSAL, module, fournir a toutes les 
classes 826 
base, pragma 297, 794, 795 

implementations par pseudo-hachage, 
necessaire avec 308 
bases de donnees 

connexions de Perl aux 123 

liaison de variables de hachage aux 335 

modules Perl pour exploiter les 518 

voir DBD ; DBI 



bases de donnees relationnelles 

lier un hachage a (Tie::DBI) 368 

lier un hachage a (Tie::RDBM) 369 

voir aussi bases de donnees 
$BASETIME 625 
basetime ($ A T) 625 
BEGIN, blocs 436, 500 

alterer l'analyse du fichier par le 
compilateur 452 

definition de @INC 276 

initialisation de variables avant l'appel de 
sous-programme 203 

ordre d'execution 451 
Benchmark, module 829 

comparer des temps d'execution de versions 
differentes de code 831-833 
bibliotheques 788,950 

bibliotheque mathematique C 506 

C/C++, charger en tant qu'extensions 
Perl 828,829 

extensions non-installees depuis 
MakeMaker 828 

ExtUtils::Liblist, module 828 

fichier de bibliotheque Perl, rechercher 472 

Perl, installer des modules dans 521 
bidirectionnelle, communication avec des 

pipes 402-404 
big-endian 

voir gros-boutiste 
/bin/sh 

voir sh 
binaire 950 

mode des handles de fichiers 650 

operateur de repetition (x) 20 

pack, fonction 718-722 
binaires, fichiers 714 

decompiler avec le module B::Deparse 450 
bind, fonction 650, 743 

exemple d'utilisation 412 

portabilite de 588 
binmode, fonction 650, 714 

avec seek et tell sur MS-DOS 588 

portabilite de 588 

pour les handles de fichier lies 359 

sysopen et 765 
biologie 

modules Perl pour la 520 
bits 950 

bits d'execution 950 
bits, operateurs sur les 88, 95 

et (~), operateur, exemple d'utilisation 860 

negation (~), operateur 860 

operateur de negation (~) 80 

surcharge 325 
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blancs 

caracteres dans les formats 214 

modificateur /x dans la recherche de 
motif 131 

normalisation dans une variable 137 
bless, fonction 226, 236, 291, 651, 953 

constructeurs, utilisation avec 291 

dereferencement implicite et 223 

exemple d'utilisation 573, 651, 730 

liaison ou 336 

typeglobs et 227 
blib, pragma 828 
blib, repertoire 505 
blocs 27, 43, 97, 99, 231 

boucles et 697 

continue, bloc 101 

declarations de paquetage, portee de 267 

simples 108-111 

faire des structures case avec 109 

vidage du tampon par 636 
blocs de bits 156 
blocs, et stat 758 
bloquer des signaux 389 
bloquer, verrous partages 391 
bloques 950 

bogues dans Perl, rapporter 872 
Booleen 950 

contexte 60 

bool, operateur de conversion 323 
operateur m// (match) en 133 

definition de la verite 26 
booleen 

contexte 953 

operateurs booleens 25 
bootstrapping (amorcer) des modules 828 
boucle 

etiquettes pour 962 
boucle foreach 29 
boucle while 24, 28 

affectation de liste dans les 65 

contexte booleen, fournir un 61 

operateur angle et $_ 69 
boucles 28, 101-108, 555, 571, 951 

commentaires et lignes blanches, rejet avant 
traitement 171 

d'extraction de tranches de tableaux 
multidimensionnels 248 

etiquettes pour 105 

eval, fonction dans les 562 

for, boucle 29, 102 

foreach, boucle 29 

infinies 103 

instruction de controle dans les 962 
iteration 963 
iteration sur 102 



last, operateur et 30, 103, 697 

next, operateur et 30, 706 

operateur s/// (substitution), utilisation sur 

des tableaux 137 
operateurs de controle pour 

instructions contre 107 
redo, operateur et 731 
reset, fonction et 734 
until, boucle 101 

utilisation dans l'assertion \G a l'interieur 
de 164 

utilisation dans les substitutions 
globales 138 

while, boucle 28, 101 
boucles infinies 

voir infinies, boucles 
break, commande (en C) 557 
break, instruction 

voir last, operateur 
BSD (Berkeley Standard Distribution) 951 
BSD::Ressource, module 

limites des ressources par processus, 
configurer des 551 
buckets 951 
buffering 976 
bundles 516 
bytecode 436,499,951 
ByteLoader, module 448, 830 
bytes, pragma 376, 795, 822 



-C (caracteres larges natifs), option de la ligne de 

commande 375 
-c (controle de la syntaxe), option de la ligne de 

commande 461, 500, 626 

compilateur, Perl 439 
C (correspondant a un seul octet en langage C), 

metasymbole joker 378 
-C (date de modification d'inode), test de 

fichier 87, 88, 625 
-c (special de type caractere), test de fichier 85 
-C (wide-characters natif), option de la ligne de 

commande 461, 641 
C, langage 951 

acceder a Perl depuis une infrastructure 
l'entourant 446 

bibliotheque, signaux provoquant des core 
dumps dans la 385 

C, pile, stocker les variables C dans la 445 

correspondre a un char 378 

fcntl.h, definitions, charger en tant que 
constantes Perl 823 

fichiers d'en-tete 959 

fonctions de la bibliotheque 644 

generateurs de code C 448 
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operateurs 

manquant en Perl 96 

operateurs logiques 89 

relations de precedence 77 
Perl, etendre avec 499, 501-507 

bibliotheque C externe, utiliser des 
fonctions venant 506 

creer des extensions 503-505 

envelopper autour de fonctions 
Perl 502 

XSUB et langage XS 501 
Perl, utiliser depuis 507 

ajouter un interpreteur Perl 508 

compiler des programmes Perl 
inseres 508 

instruction Perl, evaluer 510 

pile de Perl, manipuler 511 

sous-programme Perl, appeler 
depuis 509 

XSUB, entrees et sorties 506 
programmer en, differences avec Perl 556 
programmes d'enrobage 538 
securite par rapport a Perl 527 
structs 721 

syslog, fonctions, utilisation en Perl 823 

typedefs 500 

variables statiques 202 
\C, metacaractere joker (correspondant a un 

octet simple en C) 144, 147 
/c, modificateur de motif 139 

continuer la recherche malgre les 
echecs 163 
cache 244 

avec stat 623 

d'objets en memoire 315 

de classes de caracteres 156 

de fichiers 822 

de fichiers systeme 565, 682 

de recherches de methode 296 

exemple d'utilisation 352, 574, 575 

modules fournissant un cache 368 

web 519 

callbacks (fonctions de rappel) 761, 959 

voir aussi fonctions de rappel 
caller, fonction 652 

debogueur de Perl et 492 

et la pile de contexte 444 

exemple d'utilisation 206, 313, 351, 608, 863 

modifications entre les versions de Perl 559 

utilisation avec goto 112, 692 
can, methode (paquetage UNIVERSAL) 300 
canevas, chaines 718-722 

caracteres pour pack/unpack 718 
canonisation 

des caracteres, informations sur la 378 



capitales initiales 

voir majuscules 
capitalisation 47 

caracteres d'echappement 52 
capture dans des motifs 164-167, 951 

mots alphanumeriques 134 

suppression dans les regroupements 167 
capture la plus a gauche la plus longue 160 
capturer 

exceptions 669 
capturer la sortie 

d'une commande externe 768 

de fonctions 401 
caractere alerte (bip) 52 
caractere de mot (\w) 32 
caractere ESC 52 
caractere espace 32, 951 

caracteres proteges, utilisation en 55 
caractere separateur de ligne 43 
caractere separateur de paragraphe 43 
caractere, semantique de 

consequences de la 376 

octet, semantique d', ou 376 
caracteres 41, 951 

alias pour 146 

casse des 

voir majuscules 

convertir entre une taille fixe de 8 bits et une 
taille variable UTF-8 375 

dans des motifs 124-126 

dans les formats 718 

decomposition de 152 

droles de caracteres devant les noms de 
variable 335, 956 

entree d'un seul caractere 681 

hexadecimal 

voir hexadecimal 

jokers pour 147 

longueur en 698 

metacaracteres 124 

obtenir depuis des valeurs ASCII 657 

obtenir depuis des valeurs Unicode 657 

obtenir la valeur ASCII des 716 

octal 

voir nombres octaux 
octets ou 373, 645 
proprietes 971 

definir vos propres 155 

voir aussi under Unicode 
prototype 206 

remplacer dans les chaines 139 
special 181 
supprimer 655 

voir aussi classes de caracteres ; motifs 
caracteres de controle 51 

non-ASCII sur Macintosh 459 
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caracteres speciaux 181 
Carp, module 339, 827, 833 

voir die, fonction 

voir warn, fonction 
cartes de credit 

modules Perl pour les 520 
casse 

conversion de chaines en casse de titre 140 

mots simples, problemes avec 55 

operateurs de traduction, utiliser des tables 
Unicode 379 

sequences d'echappement pour les traiter, 
passe d' interpolation de variables 145 

supprimer la detection sensible a la 
casse 130, 131, 134, 136, 174 

voir aussi capitalization 
casse de titre 

fonctions \u et ucfirst, utilisation dans des 
conversions 140 
cat, commande (Unix) 352 
categories 

de caracteres 151 

de fonctions 646-647 
cbreak, option 681 
centrer 217 
cesures dans du texte 

module Perl pour les 518 
/eg, modificateur de motif 134 
CGI 

CGI.pm, module 834 

compartiments securises pour 544, 547 

groupes d'utilisateurs pour xxiv 

mod_Perl et xxiii 

modules Perl pour 519, 824 

necessite d'activer le mode de marquage 
pour 527 

performances sous mod_perl 445 

scripts semblant bloquer 679 

securite des scripts 414 

voir HTML 
CGI::Apache, module 824 
CGI::Carp, module 824, 834 
CGI::Cookie 824 
CGI::Fast, module 824 
CGI::Pretty, module 824 
CGI::Push, module 824 
chaine entre guillemets, interpolation et 

concatenation 20 
chaine literale 

v-chaine (vecteur ou version) 58 
chaine, conversion en 323 

d'objets 236 

de references 236, 243, 248, 249 
de structures de donnees 262 
surcharge 360 



chaines 5 

affichage de valeurs dans 237 

affichage, changer dans le debogueur 490 

afficher 725 

apostrophes 

interpolation des caracteres dans 52 
assertions de limite 35, 161 
binaires 707 

comme unite's de compilation 48 
comparaison 88 
concatenation 83, 565 

avec la fonction join 695 
contexte de 60, 953 
conversion en nombres 50 

prefixes Ox, 0b, et 0, gestion des 51 
convertir en valeurs de liste 776 
detection sur des chaines contenant des sauts 

de ligne 131 
eclater en sous-chaines 752 
entre apostrophes 

modifications entre les versions de 
Perl 560 
eval, fonction et 561 
extraire des sous-chaines 762 
formats pour les 754-757 
hexadecimales 

voir nombres hexadecimaux 
index, fonction et 693 
interpolee 7 
joindre 695 

minuscules, mise en 697 
modification 137 
octales 

voir octaux, nombres 
operateur d'intervalle, travailler avec 91 
operateurs 20, 554 
operateurs de comparaison 24 
operateurs sur les bits, travailler avec 89 
premier caractere d'une 623 
rechercher et remplacer des sous-chaines 

(operateur s///) 135 
references et 243 
rindex, fonction et 736 
saut 

voir dollar, $: dans les symboles 

study, fonction et 759 

valeur booleennes des 26 

valeurs de listes, convertir vers des 718-722 

vec, fonction et 781 

voir aussi texte 
chaines en tant que 781 
chaines litterales 51 

sauts de ligne dans les 53 
chameaux 

rose et bleu 613 
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sanglant 57 

vs. chevaux 4 
champ, specifier un separateur different 461 
changements d'environnement, pile de 444 
chapeau ( A ) 

voir chapeau dans les symboles 
chargement d'une structure de donnees depuis 

le disque 261 
charnames, pragma 377, 795, 822 
chdir, fonction 653 

avec le module Cwd 837 

comportement sans argument 471 

exemple d'utilisation 100, 535, 590, 665 

exemple de surcharge 281 

precedence et 78 
CHECK, blocs 436, 500 

ordre d'execution 451 
chemin pour les recherches de bibliotheque 630 
chemin, modules installed sur un systeme 

Windows 276 
chercher 

des sous-chames 736 
chiffrement 660 
chiffres 

dans les noms 47 
chiffres (digit) 32 
$CHILD_ERROR 625 
chimie 

modules Perl pour la 520 
chmod, fonction 16, 653 

exemple d'utilisation 72, 644, 777 

portabilite de 588 
chomp, fonction 19, 655 

$/et 632 

$\et 465 

chop ou 655 

exemple d'utilisation 558, 577, 660, 754 

longeur de chame et 379 
chop, fonction 19, 655 

efficacite de 562 

exemple d'utilisation 22, 832 

longeur de chame et 379 

voir chomp, fonction 
chown, fonction 656 

portabilite de 588 

sur les systemes POSIX 859 
chr, fonction 657 

CRLF et 414 

exemple d'utilisation 58, 326, 702 

Unicode et 147,154,379 

voir ord 
chroot, fonction 544, 657 

portabilite de 588 
circuits virtuels (en tant que flux TCP) 409 
citation 

paquetages 290 



Class::Contract, module 314 
Class::Multimethods, module 299 
Class::Struct, module 820, 835 
classe, methodes 

Thread, classe 421 
classes 266, 283, 952 
de base 

voir classes de base 
derivees 

voir classes derivees 
donnees de, gestion 315-318 

stockage de references aux donnees de 
classe dans l'objet lui-meme 317 
fonctions pour 647 

generation avec le module Class::Struct 309 

heritage 295-303 

autochargement de methodes 301 
classe UNIVERSAL et 299-301 
methodes privees, eviter avec 302 
methodes supplantees, acces aux 297 

heritage parmi les 
base, pragma 825 

implementant les hachages lies 349 

implementant les handles de fichier lies 355 

implementant tie 336 

implementation avec un pseudo- 
hachage 705 

liant des scalaires 338-342 

modules orientes objet comme definitions 
de 275 

modules ou 266 

notation de paquetage explicite 290 
numero de version, retournant un 300 
objets, creation de 291 
paquetage 79,770,778 
paquetages comme 285 
Perl 148 

tableau @ISA, inclusion avec le pragma 
base 297 

classes conteneur avec pointeurs sur des 

structures de donnees auto- 

referentielles 304 
classes de base 284, 952 

constructeurs et 294 

invoquer toutes les methodes 
supplantees 300 

supplanter les methodes de 297 
classes de caracteres 32, 148-158, 181, 952 

classiques Perl 156 

confusion avec les index de tableau 56 
correspondre avec des proprietes de 

caracteres en Unicode 378 
inversion ou negation 148 
metasymboles jokers et 147 
metasymboles utilises a l'interieur 145, 149 
personnalisees 148 
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POSIX, style 157-158 

predefinies, disponibilite de 378 

proprietes Unicode 150-157 

raccourcis Perl pour 149 
classes derivees 284, 952 

methodes servant d'emballage de methodes 
de classe de base 298 

test de la sous-classe vide 977 
classes parent 284 

clefs de correspondance, pseudo-hachages 307 
cles, hachage 

voir hachage, cles 
clients 952 

obtenir le nom de 413 

TCP 411 

UDP 415 
cloisters 952 
cloitres 168 

close, fonction 399, 658 

exemple d'utilisation 18, 100, 263, 393 

exemple d'utilisation avec des pipes 398, 
399, 711 

numeros de lignes et 631 

portabilite de 591 

verrouillage de fichier et 392 
close-on-exec, flag 543, 641, 649 

fcntlet 396,714 

socket et 747 

socketpair et 747 
closedir, fonction 659 

portabilite de 591 

voir opendir 
closures 958 

clusters dans les motifs 952 

cmp, fonction (dans File::Compare) 844 

cmp, operateur 24, 88, 747 

surcharge 326 
code 

efficacite du 567 

extraire et afficher avec les debogueurs 482 
melanger une semantique de caractere avec 

une semantique d'octet 376 
non sur 543 

compartiments de securite pour 544 

deguiser du code en donnees 548 

exemples securises 547 
reutiliser 573 
code retour (exit status) 625 
code source 

CPAN, pour la distribution Perl 516 
fenetre autour d'un point d'arret, 

examiner 477 
filtres pour le 448, 517, 585 
outils de developpement pour le 449 
code, generation 829 



code, sous-motifs dans des expressions 

rationnelles 190 
coderef 

voir sous-programmes, references de 
codes d'operation 439, 443, 500 
combinaison de caracteres, correspondance de\X 

avec 148 
commandes 

acceder avec des privileges restreints 534 

dans pod 598 

debogueur 478-486 
actions et 483 

affichage de structures de donnees 481 

documentation, consulter 486 

historique 476 

localisation de code 482 

options, manipuler 486 

pas a pas et lancement 479 

points d'arret 480 

quitter le debogueur 485 

redemarrer le debogueur 485 

tracage 481 
hachages de fonctions, stacker dans 259 
noms de 14 

pour le controle de boucle 106 

rappeler, option du debogueur 488 

tampon 976 

traiterdes 455-471 

emplacement de Perl 460 

voir interpreteurs; Perl, interpreteur 

vidage du tampon de 636 
commentaires 952 

definition 43 

en Perl ou en C, syntaxe pour les 557 

etendre avec le modificateur de motif /x 131 

jeter avant le traitement 171 

multilignes 596 
Common Gateway Interface 

voir CGI 
communication interprocessus 

voir IPC ; IPC::*, modules 
comp.lang.Perl newsgroups xxiv 
comparaison 

chaines 88 
comparaison, operateurs de 88 

sort, fonction et 747 

surcharge 326 
comparer 

chaines 554 

fichiers 821 

temps d'execution de versions de code 
differentes 829 
compartiments securises pour le code non 

sur 544 
compatibility ascendante 952 
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compatibility des caracteres, decomposition 

de 152 
compilateurs 952 

compilateur de regex 176 

declarations globales et 112 
compilateurs, Perl 626 

indications pour 630 

interpreteur, interactions avec 450-454 

modules en rapport avec les 517, 829 

sorties (backends) pour les 446 
compilation 953 

controler le debogueur durant 478 
compilation, phase 500 

ou compilation 438 
compiler 435-454, 499 

cycle de vie des programmes Perl 436 
compilation, phase de 436 
generation de code, phase de 436 
reconstruction de l'arbre syntaxique, 
phase de 437 

ducode 437-443 
ordre 454 

insere, programme Perl (dans du C) 508 
$COMPILING 626 
composites, proprietes Unicode 151 
Comprehensive Perl Archive Network 

voir CPAN 
compression 

modules Perl pour la 519 
compteurs, variables compteurs magiques 342 
COMSPEC, variable d'environnement 472 
concatenation (.), operateur de 20, 83 

autogeneration par Poperateur de 
conversion en chaine 324 

chaines constantes, surcharge 331 

efficacite de 563, 565 

exemple d'utilisation 83 
concatener des chaines 953 

avec .= 22 

avec join 695 

optimiser dans le compilateur 441 

condition, variables de 430 

conditionnel (?:), operateur 91, 110 

conditionnelles, instructions 
ecriture sans accolades 99 
expressions dans des boucles 102 
interpolations dans des motifs 194 
voir aussi instruction if; instruction unless 

Config, module 588,828 
%Config, hachage 508 
correspondance du systeme d'exploitation 
entre les noms et les numeros de 
signaux 386 

configuration 

modules Perl pour la 518 



connect, fonction 659 

exemple d'utilisation 411 

portabilite de 588 

Socket, module et 863 

utiliser le module IO::Socket au lieu de 411 
connexions 953 

arreter 745 
constant, pragma 271, 797 
constantes 271 

IPC Sytem V, definir pour les 824 

mise en ligne des fonctions constantes 208 

Perl, charger les definitions de fcntl.h en tant 
que 823 

surcharge 330 
constructeur de copie 328 
constructeurs 226, 283, 291-295, 953 

fonction bless et 291 

heritables 292 

import, methode 706 

initialisation 293 

nommage 293 

noms de classe ou objets, fonctionnement 

avec 292 
variables de classe liees 336 
verifications d'acces, specification dans 

les 313 

construire des modules de CPAN 521 
contexte 59-62,953 
booleen 60 
conditionnel 

voir contexte booleen 
de guillemets doubles 

etendre dans les variables scalaires 135 
deliste 36-38,59,953 

affectation de liste en 94 

appel et evaluation de sous-programmes 
en 199 

expressions en, voir LIST 

hachage dans un 11 

instruction foreach, dans un 29 

lvalues en 115 

m//g, lister toutes les occurrences en 133 
operateur angle dans le 70 
operateur antislash le fournissant 236 
operateur conditionnel en 92 
operateur d'intervalle (..) en 90 
operateur m// (match) en 133 
operateur virgule en 94 
variables de hachage, utilisation dans 
les 66 

de tableau 

voir contexte de liste 

entre guillemets 61 

interpolatif 61 

interpolatif (entre guillemets) 61 
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numerique 60, 953 
scalaire 59 

affectation de liste dans un 64, 94 

appel et evaluation de sous-programmes 
en 199 

contexte vide 61 

expressions en, voir EXPR 

lvalues en 115 

operateur conditionnel en 92 
operateur d'intervalle (..) en 90 
operateur m// (match) en 133 
operateur virgule en 94 
types derives 60 

utilisation dans le modificateur de motif 
/g 134 

valeurs booleennes et 61, 953 
variables de hachage, evaluation dans 
un 66 

scalaire et liste 59 

vide 61,64,783,953 

void 23 

voir aussi contexte de liste ; contexte scalaire 
contextes, pile de 444 
continuation lines 954 
continue, bloc 101, 105, 106 

voir aussi boucles 
continue, commande (en C) 557 
contractions dans les mots, eviter la confusion 

avec les guillemets simples 184 
contrat entre le module et l'utilisateur 278 
controle, caracteres de 157 

metasymboles dans des motifs 146 
controle, variables de 103 
conversion, operateurs 

contexte booleen, interpretation d'un objet 
en 323 

conversion en chaine 323 

numification (conversion de non-nombre en 
nombre) 323 
convertir 

dateetheure 690,700 

des caracteres vers des valeurs ASCII 716 

des chames en valeurs de liste 752, 776 

des langages entre eux 585 

des nombres hexadecimaux en 
decimaux 692 

des nombres octaux en decimaux 707 

des valeurs de liste en chaines 695, 718 

entre des entiers et des caracteres UTF-8 379 

formats de fichiers 

modules Perl pour 519 

nombres vers/depuis de l'hexadecimal 136 

une valeur ASCII en caractere 657 

une valeur Unicode en caractere 657 



cookies (HTTP), lire et ecrire 824 
copie lors d'ecritures, semantique 418 
copier des fichiers ou des handles de fichiers 821 
copy-on-write, semantique 

voir copie lors d'ecritures 
core dump (copie du cceur du programme) 

dump, fonction pour 667 

probleme de saturation des serveurs avec les 
correspondances de motifs 551 

provoques par des signaux dans la 
bibliotheque C 385 

Thread::Signal, module, empecher avec 433 
core, fichiers 469 

CORE, pseudo-paquetage 282, 298 
CORE::GLOBAL pseudo-paquetage 282 
correspondance (??), operateur 

voir m?? 
correspondance (m//), operateur 

voir m/l 
correspondance avide 34, 950 
correspondance la plus a gauche, la plus 

longue 963 
correspondance large 

symboles 43 
correspondance minimale 34 
correspondance minimale ou maximale, 

indiquer 33 
correspondances possibles, specifier Pensemble 

des 168 
cos (cosinus), fonction 659 

complexes, nombres et 857 

exemple d'utilisation 443, 650 

Math::Trig et 858 
CPAN (Comprehensive Perl Archive 

Network) xviii, 13, 266, 275, 515, 954 

modules 828, 836 

categories de modules 517 
construire 521 
creer 522 

decompresser et depaqueter 520 
installer dans la bibliotheque Perl 521 
installer des modules avec 520 
installer et construire 520 
portabilite des 592 
repertoire 516 

modules de liaison 368-369 

sous-repertoires 515 
CPU 

acceder dans un environnement 

multitaches 536 
temps pour les processus 772 
threads cedant la priorite 424 
variables de condition permettant aux 

threads d'abandonner 430 
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cracker 954 
CRLF 

dans les programmes Internet 414 

voir sauts de ligne 
crochets ([]) 

voir crochets devant Symbols 
crypt, fonction 660 

exemple d'utilisation 65 

portabilite de 588 
cryptage 

modules Perl pour le 518 
cryptographie 757 
Ctrl-A 135 
Ctrl-C 52 

signaux, gestionnaire pour les 385 
Ctrl-C et Ctrl-Z, generer des signaux avec 384 
Ctrl-D pour eof (fin de fichier) 59, 584 
Ctrl-Z pour eof (fin de fichier) 59, 584 
Curses 

modules Perl pour 518 
CV (internal code value) 954 
Cwd, module 821 

repertoire de travail courant pour le 
processus, determiner le 837 
cycle de vie des programmes Perl 436 

compilation, phase de 436 

execution, phase d' 437 

generation de code, phase de 436 

reconstruction de Farbre syntaxique, phase 
de 437 

D 

A D (Ctrl-D) pour eof 584 

-D (debogage), option de la ligne de 

commande 462 
-d (debogage), option de la ligne de 

commande 461, 475, 494 
-d (repertoire), test 25 
-d (repertoire), test de fichier 85 
/d, modificateur de motif 139, 140 
dangereuses, operations 469 
dans les scripts 746 
datatypes 978 
DATA, handle de fichier 626 
Data::Dumper, module 262, 825, 838 

DATA , symbole 59 

_DATA__, token 626 
databases 

Data Base Management 
voir DBM, fichiers 
datagrammes 954, 955 

voir aussi paquets 

date 

fichier, acces/modification 758 
fonctions Perl pour 647 



modules Perl pour 517 

portabilite 593 
date d'acces, et stat 758 
date de creation, et stat 758 
date de modification, et stat 758 
dateetheure 772 

acces/modification de fichiers 780 

Greenwich Mean Time(GMT) 690 

pour le meridien local 700 

Time::Local, module 820 

UPD, programme pour obtenir depuis 
d'autres machines 415 
date, fonction 

voir localtime, fonction 
DB, module 825 

caller, fonction 653 
DB_File, module 824 

Data::Dumper, utiliser avec le module 838 
DBD (Database drivers) 

modules Perl pour 518 
DBI (Database Interface) 

modules Perl pour 518 
DBM, fichiers 954 

dbmclose et dbmopen, fonctions 661 

modules pour les 824 

portabilite des 592 

supprimer dans 663 

valeurs de donnees complexes, stocker dans 
des 838 

verrouiller 393 
dbmclose, fonction 335 

portabilite de 588 
dbmopen, fonction 335 

DBMs et 337 

portabilite de 588 

verouillage et 393 
deadlock dans les threads 427 
debogage 461, 475-498 

arguments 626 

bogues de securite d'Unix 537 

code du debogueur, commande pour 
charger 472 

commandes du debogueur Perl 478-486 

controler depuis les programmes 478 

DB module 825 

debogueur, execution autonome 490 
declencher dans un handle de fichier lie 362 
destruction globale d'objets et d'autres 

references, controler 472 
Devel::Peek, module pour les programmes 

XS 826 

erreurs courantes des debutants 553-560 
implementation du debogueur, Perl 492 
modules de sorties (backends) pour 446 
niveau de debogage, specification par la 
classe ou les instances 316 
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Perl, utilisation de l'option -DDEBUGGING 

du compilateur C 296 
personnalisation du debogueur 487-490 
pour les programmeurs cerebraux du C 556 
pour les programmeurs penitents de 

Perl 4 558 

pour les programmeurs sherifs du shell 557 
rapports de bogues xxv 
surcharge 333 
symbolique 954 

tableaux multidimensionnels 249 

voir marquage, verification 
debogueur, ligne de commande 489 
$DEBUGGING 626 

debutants, erreurs courantes des 553-560 
debuts de chaines, detection 161 
decalage 

pour les reussites de mil 725 

read, fonction et 729 

seek, fonction 738, 739 
decalage a droite (»), operateur 

voir superieur dans les symboles 
decalage a gauche («), operateur 

voir inferieur dans les symboles 
decalage binaire («, ») 954 
decalage de bits («, »), operateurs 83, 93 

voir aussi superieur et inferieur dans les 
symboles 
decalage, operateurs de 83 
dechiffrement 

voir chifffement 
declaration local 115, 116 

utilisation sur des variables globales 119 
declaration our 

regies de contexte et 60 
declarations 3, 97-122, 680, 955 

champs (avec le pragma use fields) 306 

formats 213 

methodes, indication de retour de 

lvalue 314 
paquetage 12,114,267,722 
portee 114 

sous-programme 112, 197, 761 
anonyme 197 

struct 309 

variables 97, 114 

variables globales 112 
a portee lexicale 118 
declarative, approche de la programmation des 

expressions rationnelles 187 
decomposer les caracteres en caracteres plus 

simples 152 
decomposition normalisee de caracteres 152 
decompresser des modules de CPAN 520 



decrementation des variables 22 
DEFAULT, pseudo-signal 386 
defined, fonction 662 

exemple d'utilisation 270, 394, 396, 654, 
661, 712 

sous-programmes et 198 

voir undef, fonction 

wantarray et 201 
defined, fonction, ou exists ou vrai 673 
definitions 955 

classes (modules orientes objet comme) 275 

sous-programmes 199 

chargement avec AUTOLOAD 273 
chargement depuis d'autres fichiers 113 
declaration contre 112 
DEL en hexadecimal 52 
delete, fonction 663 

exemple d'utilisation 234 

pseudo-hachages et 234 

tableaux lies, ne renvoyant pas les valeurs 
detruites pour 560 

undef ou 775 
delimiteurs 955 

operateurs de detection de motifs et 129 
Democrite 540 
demons 

marquage, importance d'activer le mode 
de 527 

modules Perl pour les 519 
denial-of-service 

voir saturation des serveurs 
depannage 

voir debogage 
depaqueter des modules de CPAN 520 
dequeue, methode (Thread::Queue, 

module) 431 
dereference, surcharge des operateurs 327 
dereferencement 955 

dereferencement d'adresse (*), operateur de 
C 96 

dereferencement infixe, operateur 

voir fleche (->), operateur 
dereferencement symbolique 

verification avec le pragma strict 122 
dereferencer 223, 229, 230, 231 

elements de tableaux 248 

operateur 

voir fleche (->), operateur 

typeglobs 270 

valeurs de hachages en tant que 

fonctions 259 
voir aussi references 
deroulement 
voir execution 
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deallocation memoire 244 
descripteurs de fichiers 676, 740, 955 

handles de fichiers, passer avec des 395 
passer via une variable d'environnement ou 
une option de la ligne de 
commande 396 
destructeurs 303, 955 
controler 472 

memoire partagee et semaphore 408 

ramasse-miettes et 304 
detach, methode 423 
detecter 

valeurs definies 662 
detection de motifs 

voir patterns 
detection sequentielle 179 
detruire 

voir supprimer 
detruire des threads 

detach, methode 423 

join, methode 422 
Devel::DProf, module 825 

profiler Pexecution de sous-programmes 
avec 494-497 
Devel::Peek, module 826 
DevehSmallProf, module 497 
developpement, modules pour le support 

du 517 
devices (hardware) 968 
diagnostic, messages de 

voir erreurs, messages d' 
diagnostics, pragma 798, 826 
diagrammes, generation 213 
die, fonction 665 

alarm et 389 

dans les gestionnaires de signaux 385 
des erreurs fatales, provoquer 957 
END, blocs et 452 
evalet 670 

exemple d'utilisation 78, 90, 100, 570 

gestionnaires de signaux et 385-386 

mettre la valeur de retour pour 635 

sigtrap, pragma et 809 

voir DIE 

voir Carp, module 

warn ou 783 
_DIE_, routine 639-640 

exemple d'utilisation 784 
dieLevel, option du debogueur 488 
different 

voir egalite, operateurs d' ; relation, 

operateurs de) 
different de (!=), operateur 88 

voir aussi point d'exclamation dans les 

symboles 
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directives (pod) 598, 955 
disciplines 714 
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DNS (serveur de noms de domaine) 409 
do 78 

BLOC 98 
iterer 108 
terminaison 109 

bloc 666 

controles de boucle 98, 108, 555 

FICHIER 666 

require ou 666 

SOUS-PROGRAMME 667 

SUBROUTINE 98 
doc, repertoire (CPAN), pages de manuel 

officielles de Perl 515 
documentation 

de modules standard 275 

fonctions de la bibliotheque 644 

inseree dans des programmes Perl 595 

livres sur Perl xxii 

modules pour la 827 

pages du manuel xix 

rapports de bogues xxv 

visionneuse par defaut du systeme, 
appeler 486 
documents « ici-meme » 56, 956 

fin de fichier 957 

indentation d'un 57 
dollar ($) 

voir dollar dans les symboles 
donnees 

de longueur fixe, fonctions pour 646 
non sures 526 

acces aux commandes et aux fichiers 
avec des privileges restreints 534 

deguiser du code en donnees 548 

detecter et blanchir des donnees 
marquees 529 

environnement, nettoyer 533 
orientees octet ou orientees caractere 373 
vidage a l'ecran 826 
donnees d'instance 293, 304-315, 979 
ecriture de fonctions differentes pour 

chaque 305 
generation d'accesseurs par auto- 

chargement 309 
generation d'accesseurs par fermetures 311 
generation de classes avec Class::Struct 309 
nouvelles fonctionnalites, Perl 5.6 314 
utilisation de fermetures pour objets 

prives 312-314 
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donnees membres 293 
donnees, types de 

modules pour les 820 
dosish.h, fichier 458 
down, methode (Thread::Semaphore, 

module) 432 
DProf 

voir Devel::DProf, module 
dprofpp, programme 495-497 
drapeaux 956 

voir aussi modificateurs ; selecteurs 

voir options, ligne de commande 

voir modifiers 
droles de caracteres 335, 956 
dump, fonction 667 

portabilite de 588 
Dumpvalue, module 826 

dupliques, eliminer les caracteres remplaces 142 
duree 

d'execution d'un script 87 
dweomer 956 
dwimmer 956 

DynaLoader, module 274, 503, 828 
dynamique, edition de liens 502 
C, code source depuis Perl 501 

E 

/e (evaluation d'expression), modificateur de 

motif 139, 189 
-e (executer), option de la ligne de 

commande 456, 463 
-e (existe), test de fichier 85 
-e (fichier existe), test 25 
each, fonction 258, 668 

efficacite de 566 

exemple d'utilisation 770 

hachages lies et 349, 354 

keys et 695 

voir keys 

voir values, fonction 
echappement pour les caracteres de controle, 

sequence de 173 
echappements dans les chaines litterales, 

sequences d' 822 
echecs, continuer la recherche malgre 163 
ecraser des fichiers existants, situations de 

concurrence et 539 
ecrire 

dans des fichiers, mode d'ouverture et 710 
dans des segments de memoire partagee 745 
des donnees via des appels systeme de has 

niveau 725,726,769,784 
des scripts 

voir scripts 



editeur de texte 

comptage des lignes, differences avec 
Perl 43 
editeur vi 

expressions regulieres, utilisation des 30 
editeurs de texte 

ecriture de scripts dans les 16 
editeurs, implementation du debogage pour 

les 487 

edition sur place ($ A I, $INPLACE_EDIT) 463, 

631 
effacer 

caracteres trouves mais non remplaces 139 

voir supprimer 
$EFFECTIVE_GROUP_ID 626 
$EFFECTIVE_USER_ID 627 
efficacite 

dans les programmes Perl 561-569 

profiler 494 

programmer en Perl avec 568 
egal a (==), operateur 88 
egalite, operateurs d' 88 
elements de hachage 663 
elements de tableaux 8, 956 
else, instruction 27 
emacs 

-*-, sequences 457 

expressions regulieres, utilisation des 30 

implementation pour le debogueur 487 
email 

voir mail 
emboitements 

destruction 303 

listes 245 

sous-programmes 240 

tableaux 245-252 
empaquetage sockaddr 685 
en-tete de formulaire, traitement 785 
en-tete, traitement 739 
en-tetes, noms de format 218 
encapsulation 12, 233, 284, 956 

basee sur les espaces de noms 369 

objets dans les fermetures 312 
encryptage 

modules Perl pour 1' 825 
END, blocs 436 

court-circuiter 452 

ordre d'execution 451 

valeur de sortie d'un programme, 
modifier 453 

END , token 59, 566, 584, 626 

endgrent, fonction 681 

portabilite de 588 
endhostent, fonction 684 

portabilite de 588 
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endnetent, fonction 647 

portabilite de 588 
endprotoent, fonction 687 

portability de 588 
endpwent, fonction 687 

portability de 588 
endservent, fonction 689 

portability de 588 
English, module 217, 826 
enqueue, methode (Thread::Queue, 

module) 431 
enregistrements 

de diverses structures de donnees 259-262 
composition, acces et affichage 260 
generation d'un hachage de 261 

fonctions pour 646 

longueur variable 215 

mode par 632 

separateur en entree 

voir dollar, $/ dans les symboles 

separateur en sortie 

voir dollar, $\ dans les symboles 
enrobage 

C, autours des scripts set-id 538 
enrobage de texte 

module Perl pour 1' 518 
ensembles, intersection 204 
entiers 693, 720, 957 

chaines en tant que vecteurs d' 781 

convertir vers des caracteres UTF-8 379 

dans les options de la ligne de 
commande 853 

empaquetes et compresses dans des 
chaines 718,781 

enC 43 

exponentiation 511 

formats 51,720,755,756 

IV (valeur entiere interne) 963 
typedefenC 500 

module Math::BigInt 319 

modules standards pour de l'arithmetique 
avec des 820 

motifs, exemples d'utilisation avec 171 

operateurs sur les bits avec 89 

stockage compact des 566 

surcharge 330 

voir integer, pragma 

voir Math::BigFloat, module 

voir Math::BigInt, module 
entrailles 499 
entree 

debogueur, selectionner 491 
des pipes 397-405 

bidirectionnels 402 

pipelines sur plusieurs niveaux 399 

tridirectionnels 402 
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voir aussi tableau @ARGV ; handle 
STDIN 
operateurs 68 

separateur d'enregistrements en 
voir dollar, $/ dans les symboles 

STDIN, handle de fichier 677 

un seul caractere, avec et sans tampon 681 

verifier les descripteurs de fichiers pour 
la 740 

entree dans le fichier passw 687 
entree standard 
voir STDIN 
entrees 

fichiers, detecter la fin avec eof 465 

fichiers, mode d'ouverture pour les 710 

fonctions pour 646 

utiliser ioctl pour les 694 

XSUB 506 
%ENV, hachage 627 

portabilite de 591 

supprimer dans 663 
Env, module 826 

env, programme, commencer perl avec 457 
envelopper du texte 820 
environnement 957 

nettoyer 533 
environnement, variables 471-473, 627 

en shell ou en Perl 558 

Env, module 826 

marquage,verification 527 

portabilite des 591 
EOF (fin de fichier) 957 
eof, fonction 28, 565, 668 

exemple d'utilisation 91, 107, 606 

handle de fichier lie, utilisation avec 359 

sysread et 767 
eq, operateur 24, 88, 554 

exemple d'utilisation 27, 30 
equal, methode (Thread, module) 424 
equilibrage de texte 219 
erreur standard 

voir STDERR 
erreurs 

$?, variable pour 625 

$@, variable pour 627 

(out-of-memory) erreurs de depassements en 
memoire 634 

Carp, module 833 

CGI::Carp, module, manipuler 834 

donnees non sures 528 

echec d'exportation de symbole 280 

numero (errno) 957 

sous-programmes 201 

STDERR, handle de fichier 677 

variable $! pour 635 
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warn, fonction produisant des messages 
d'erreur 783 
erreurs de dependance non sure 528 
erreurs fatales 957, 958 
erreurs, messages d' 573, 871-945 

efficacite pour l'utilisateur, ameliorer 569 
ermo 957 

voir aussi dollar, signe $! parmi les symboles 
; $OS_ERROR 
%ERRNO, hachage 

voir %OS_ERROR, hachage 
Errno, module 826 
espace 42, 570, 643 
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les constructions protegees, 
modification pour 559 

devant, supprimer documents « ici- 
meme » 57 
espace arriere 

\b dans les classes de caracteres 144, 149, 
162, 181 
espace de nommage 46 

des paquetages 13 
espace de noms 957 

acces, restreindre avec le module Safe 544 

encapsulation a partir de 369 

modules et 278 

voir aussi paquetages 
espaces finaux dans les comparaisons de 

chaines 88 
est une sorte de 957 
et (&&), operateur logique 89, 95 

precedence de and par rapport a && 23, 289 
et (&), operateur sur les bits 88 
et logique (&&), operateur 23 
etat 

heritage avec methodes accesseurs de 
classe 318 

objets de classe et 315 
/etc/group, fichier 565, 681 
/etc/hosts, fichier 684 
/etc/networks, fichier 685 
/etc/passwd, fichier 565, 687 
/etc/protocoles, fichier 687 
/etc/services, fichier 689 
/etc/utmp, fichier 684 
etendre la longueur 65 
etendre Perl 501-507 

extensions, creer des 503-505, 825, 958 

utiliser des fonctions venant d'une 
bibliotheque C externe 506 

XSUB et langage XS, envelopper du Perl 
dans 501 

XSUB, entrees et sorties 506 
etiquettes 99, 106, 957 

boucles et 101, 105, 571, 908, 962 
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etoile 

voir asterisque 
eval (Safe, module) 545 
eval exec, bidouille 17, 457, 468, 583 
eval, fonction 48, 78, 221, 561, 669 

AUTOLOAD, utilisation dans 273 

boucles et 106, 108, 562 

caller et 653 

chaines et 117 

code interpole et 550 

die, fonction et 585, 665 

do et 666 

donnees marquees, utiliser pour 529, 547 
erreurs 627 

exceptions dans les threads, utilisation 

avec 424 
exceptions et 640, 647 
execution et 438 
exemple d'utilisation 207 
lucarne, optimisation et 441 
paquetages et 269 
pendant la compilation 436 
qret 760 

reconstituer des structures de donnees 

avec 262, 838 
retour, valeur de 579 
return et 735 
s///ee et 137, 187 

surcharge, modification a l'execution 333 

traduire avec les variables 140 

utilisation dans les formats 217 
eval, methode dans les threads 423 
$EVAL_ERROR 627 
eval_sv et eval_pv, fonctions 510 
evenements asynchrones 949 
exceptions 958 

capturer 669 
threads 423 

dans les threads fils detaches 424 

des erreurs fatales, provoquer 957 

die et 665 

donnees non sures 528 

fonctions levant 648 

intercepter 639 

lever lors d'un echec 826 

lever pour indiquer une erreur dans un sous- 
programme 201 

modules pour les 827 
$EXCEPTIONS_BEING_CAUGHT 628 
exclusifs, verrous de fichier 391 

obtenir 392 
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exec, fonction 671, 768, 958 
END, blocs et 437, 452 
exemple d'utilisation 528, 535 
forket 673 

forme avec un argument de liste, eviter le 
shell avec la 549 

handles de fichiers, laissez ouverts entre les 
appels 395, 641, 714 

portabilite de 588,592 

supplanter, lever une exception lorsque 842 

voir system 
executable, fichier d'image 436 
$EXECUTABLE_NAME 628 
executer 

autonome (parcours des options) 490 

d'autres programmes depuis Perl 768 

des programmes Perl 16, 437, 455 

ducode 443-446 
conditionnel 24 
ordre 454 

methodes 285-291 
execution conditionnelle de code 24 
execution, phase 

ou execution 438 
execv, fonction (en C) 672 
execvp, fonction (en C) 671 
existence d'un processus 

verifier 387 
exists, fonction 575, 673 

delete et 663 

exemple d'utilisation 310, 313, 473 
hachages lies et 347 
invocation sur un hachage 354 
pseudo-hachages et 234 
exit, fonction 3, 457, 674, 679 
END, blocs et 453 
exemple d'utilisation 394 
threads et 422,424 

traitement en batch, utilisation pour le 569 
exp, fonction 675 

exemple d'utilisation 14 
expansion, nom de fichier 689 
expat, analyseur XML 580 
Expect, module 403, 519 
exponentiation (**), operateur 80 
exponentiation d'entiers 511 
©EXPORT, tableau 628 
export_fail, methode 280 
@EXPORT_OK, tableau 628 
%EXPORT_TAGS, hachage 628 
export_to_level, methode 280 
exportation de symboles 275, 277, 278, 958 

sans utiliser la methode import de 
Exporter 280 
Exporter, module 503, 828 

espace prive de module et 278-281 
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boucles et 102 

EXPR et LIST 99 

goto et 111 

s///eet 187 
expressions alertes 958 
expressions regulieres 

voir motifs 
$EXTENDED_OS_ERROR 629 
extensions de langage 

modules Perl pour 517 
externes, portabilite des sous-programmes 592 
extraire des sous-chaines 762 
ExtUtils::Command, module 828 
ExtUtils::Embed, module 508, 828 
ExtUtils::Install, module 828 
ExtUtils::Installed, module 828 
ExtUtils::Liblist, module 828 
ExtUtils::MakeMaker, module 522, 828 

voir MakeMaker 
ExtUtils::Manifest, module 828 
ExtUtils::Mkbootstrap, module 828 
ExtUtils::Mksymlists, module 828 
ExtUtils::MM_Cygwin, module 828 
ExtUtils::MM_OS2, module 828 
ExtUtils::MM_Unix, module 828 
ExtUtils::MM_VMS, module 828 
ExtUtils::MM_Win32, module 828 
ExtUtils::Packlist, module 828 
ExtUtils::testlib, module 828 

F 

-f (fichier normal), test de fichier 85 

-f (fichier regulier), test 25 

-F (motif pour eclater), option de la ligne de 

commande 461, 463 
@F, tableau 629 
fallback, clef de surcharge 329 
FAQ de Perl en ligne 553 
Fast CGI, protocole 824 
Fatal, module 826 
fcntl, fonction 675 

close-on-exec, flag, manipuler 396, 543 

Fcntl, module et 842 

flag close-on-exec, manipuler 714 

flock et 677 

h2ph et 790 

ou FileHandle, module 852 

portabilite de 588 

risques de securite associes a 543 

valeur de retour 694 
Fcntl, module 823,842 
fermetures 117,237-241,761 

affectation a glob pour definir un sous- 
programme 273 

comme patrons de fonctions 239 
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creation 198 

dans les threads 421 

exemple d'utilisation 303 

generation de methodes accesseurs par 311 

handles de fichier lies 358 

objets prives, utilisation pour 312-314 

serveurs, les connexions (demi- 
fermeture) 412 

sous-programmes imbriques, emulation 
avec 240 
fichier regulier, test de 25 
fichier texte (operateur de test) -T 25 
fichier, descripteurs de 

retour pour les handles de fichier lies 360 
fichier, tronquer 773 
fichiers 958 

acceder avec des privileges restreints 534 

ages des 87 

changer le nom de 733 

composants de chemin, separateurs pour 

les 590 
core 469 

dans les communications 

interprocessus 390-397 

passer des handles de fichiers 394-397 

verrouillage, mecanismes de 390 
date d'acces et de modification 758, 780 
de modules, autochargement 274 
descripteurs 

voir descripteurs de fichiers 
distinction texte/binaire 714 
do FICHIER, operateur 666 
ecrire via des appels systeme de bas 

niveau 769 
end-of-file (EOF : fin de fichier) 668 
executable 959 
fermer 658 

fin de fichier (EOF) 957 
fonctions pour 646 
handles de 

voir handles de fichier 
lier symboliquement 763 
lire via des appels systeme de bas niveau 767 
mode binaire 650 

module Perl, stockage dans un seul 266 
modules Perl pour les 518, 519 
modules pour les conversions de 

formats 519 
obtenir les statistiques de 758 
open, fonction 707 
operateurs de test 

voir tests de fichier 
ouvrir via des appels systeme de bas 

niveau 765 
permissions 766, 774 
portabilite pour ouvrir des 591 
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renommer, programme pour 670 
renvoyer la position actuelle dans les 770 
supprimer 775 
temporaires 850 

utilisateur et groupe proprietaries, 
changer 656 

variables scopees et 49 

Win32API::File, module 831 
fichiers binaires 

reguliers 25 
fichiers d'en-tete 959 

voir aussi modules 
fichiers DBM 

stockage de donnees complexes dans 368 

voir DBM, fichiers 
fichiers executables 959 
fichiers irreguliers 25 
fichiers point, manipulation avec hachages 

lies 350 
96FIELDS, hachage 629 
fields, pragma 297, 306-309, 800, 826 

declarations de champ avec 306-309 
FIFO 404 
FIFOs 959 

File::Basename, module 590, 821 
File::CheckTree, module 821 
File::chmod, module 654 
File::Compare, module 821 
File::Copy, module 821 
File::DosGlob, module 821 
File::Find, module 821 
File::Glob, module 821 
File::Path, module 821 
File::Spec, module 590, 821 
File::Spec::Functions, module 821 
File::Spec::Mac, module 821 
File::Spec::OS2, module 821 
File::Spec::Unix, module 821 
File::Spec::VMS, module 821 
File::Spec::Win32, module 821 
File::stat, module 821 

exemple d'utilisation 849 

voir stat, fonction 
File::Temp, module 

situations de concurrence, potentiel pour 
des 542 
_FILE__, token 59,584 
FileHandle, module 217, 219, 822 
fileno, fonction 676 

portabilite de 588 

voir aussi fichier, descripteurs de 
files 245 
files d'attente 

Thread::Queue, module 431 
filetest, pragma 86, 803 
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fils, processus 398 

accessibles en lecture, demarrer 398 

voir processus 
filtrer la sortie avec un open sur un fork 400 
filtres 959 

code source 37, 585 
fin (quit), gestionnaire pour le signal de 385 
fin de chaine, detecter 161 
find, fonction 32 

parcourir des arborescences de fichiers 
comme 821 
FindBin, module 828 
findstr, fonction 30, 32 
finir 

voir terminer 
fins de ligne 

dans les programmes Internet 414 
fins de ligne, traitement automatique 465 
fixe, taille de caractere sur 8 bits 375 
flags (drapeaux) 

voir options, ligne de commande 
fleche (->), operateur 

pour dereferencer des references 231 

voir aussi hyphen under Symbols 
flock, fonction 340, 677 

alarmes et 389 

portabilite de 588 
flux des programmes, fonctions pour le 

controle 646 
fmt (utilitaire Unix) 218 

FMTEYEWTK (Far More Than Everything You 

Ever Wanted to Know) 959 
fonction definie 955 

operateur entree de ligne et 69 

tableaux et 61 
fonctions 14, 643-785, 959 

arguments par defaut, eviter les erreurs avec 
les 556 

autochargement 273-274, 301 
bibliotheque C 644 

dans un contexte scalaire ou de liste 645 
debogueur, appeler les fonctions 

internes 488 
enrobages orientes octet pour les 377 
generation 238 
hachages de 259 
internes, lister par type 827 
interpolation 348 
inventaire par categorie 646-647 
modeles pour 

voir fermetures 
modules, exportation vers des 

programmes 278 
noms de 572 
operateurs de retour 106 
operateurs et 75 
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Perl, envelopper autour de C 502 

Perl, variant entre les plates-formes 588 

personnalisation du debogueur 494 

pour gerer des signaux 384 

publiques de surcharge 332 

references comme entree et sortie 204 

retournant une donnee marquee 648 

sockets, relatives aux 409 

supplanter 281-282 

temporaires, generer des noms de 
fichiers 541 

Thread, module 421 

voir sous le nom specifique de la fonction 

voir aussi sous-programmes 
fonctions de rappel (callbacks) 238, 761 

dans Pod::Parser 607 

dans XML::Parser 580 
fonctions definies par l'utilisateur 

voir sous-programmes 
fonctions diverses 646 
fonctions systemes 

appels systeme vs. xxii 
fonctions, appels de 78 

pipe, de bas niveau pour les communication 
bidirectionnelles 403 

fontes 

modules Perl pour les 518 
for 29, 98, 102 

comme alias de foreach 103 

rechercher et remplacer des elements dans 
des tableaux 137 
foreach, boucles 98, 103, 561 

$_et 110 

modifications entre les versions de Perl 560 
rechercher et remplacer des elements dans 

des tableaux 137 
variable de boucle, programmer en shell ou 

en Perl 557 
fork, fonction 399, 678, 959 
$$et 638 

doner des interpreters sur Windows 418, 
445 

double sens, communication avec 403 
exec et 673 

exemple d'utilisation 395 
fork-open 399, 712 

heriter des handles de fichiers du pere 397 

open sur un pipe, eviter le shell dans un 535 

ou modele de thread 419 

perlfork, documentation 384 

pipes et 398, 724 

portabilite de 588,592 

processus fils, heriter des handles de fichiers 

du pere 394 
serveurs, clones avec 413 
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shutdown et 745 
socketpair et 747 

traitement en batch, utilisation pour le 569 
verrous, heritage a travers les appels a 678 
waitet 782 

zombies, processus et 387 
format, declaration 

voir write, fonction 
$FORMAT_FORMFEED 629 
$FORMAT_LINE_BREAK_CHARACTERS 629 
$FORMAT_LINES_LEFT 629 
$FORMAT_LINES_PER_PAGE 629 
$FORMAT_NAME 630 
$FORMAT_PAGE_N UMBER 630 
$FORMAT_TOP_NAME 630 
formatage de presentation (marshalling), 

modules de 838 
formats 213-219, 959 

acces aux 219 

accumulateur de sortie 680 

B::Xref, module, references croisees avec du 
C 449 

declaration 213 

declarer 680 

entiers 720 

fmt (utilitaire Unix) 218 

listes d'arguments pour les, evaluer en 

contexte de liste 559 
numeros de page 630 
pack/unpack 718-722 
pieds de page 218 
pour les chaines 754-757 
traitement du haut de page 215 
variables 216 

variables lexicales dans 216 
formels (arguments) 625 
formline, fonction 219, 680 

$ A Aet 624 
Fortran 42 

fossoyer les processus zombies 387 

serveurs 414 
freeware 959 

G 

/g (global), modificateur de motif 134, 136 
-g (setgid), test de fichier 85 
\G, assertion de position 134, 163 
GDBM (GNU DBM) 

verrouiller des fichiers sous 394 
GDBM (GNU DBM) GDBM_File, module 825 
ge, operateur 24 

voir aussi angle droit dans les symboles 
generateurs de code 446, 447-449, 959 

bytecode, generateur de 447 

C, generateur de code 448 
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autres langages en Perl 583 

dans d'autres langages 584 

filtres de code source 585 
generation de code 436 
gestionnaires 

de signaux 384 
getc, fonction 563, 681 

et les handles de fichier lies 357 
getenv 

voir environnement, variables 
getgrent, fonction 681 

portabilite de 588 

supplanter 868 
getgrgid, fonction 

portabilite de 588 
getgrid, fonction 682 
getgrnam, fonction 682 

portabilite de 588 
gethost*, fonctions internes, supplanter les 824 
gethostbyaddr, fonction 682 

cache, mettre les valeurs de retour dans 
un 565 

exemple d'utilisation 413, 415 
getpeername et 685 
portabilite de 588 

reconvertir des caracteres en octets 375 

Socket, module et 863 

supplanter 858 
gethostbyadr, fonction 

exemple d'utilisation 689 
gethostbyname, fonction 683 

exemple d'utilisation 413 

portabilite de 588 

Socket, module et 863 

supplanter 858 
gethostent, fonction 684 

portabilite de 588, 684 
getlogin, fonction 684 

portabilite de 588 
getnet*, fonctions internes, supplanter les 824 
getnetbyaddr, fonction 684 

portabilite de 588 
getnetbyname, fonction 685 

portabilite de 588 
getnetent, fonction 685 
Getopt::*, modules 107 
Getopt::Long, module 821 
Getopt::Std, module 821 
getpeername, fonction 413, 685 

exemple d'utilisation 863 
getpgrp, fonction 685 

portabilite de 588 
getppid, fonction 686 

exemple d'utilisation 696 

portabilite de 588 
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getpriority, fonction 686 
portability de 588 

setpriority, exemple d'utilisation avec 743 
getproto*, fonctions internes, supplanter les 824 
getprotobyname, fonction 686 

exemple d'utilisation 415 

portabilite de 588 

Socket, module et 863 
getprotobynumber, fonction 686 

portabilite de 588 
getprotoent, fonction 687 

portabilite de 588 
getpwent, fonction 687 

exemple d'utilisation 65, 663 

portabilite de 588 

supplanter 869 
getpwnam, fonction 687 

exemple d'utilisation 351, 656 

portabilite de 588 

supplanter 869 
getpwuid, fonction 684, 688 

determiner le nom et les infos d'un 
utilisateur 797 

determiner le repertoire personnel avec 90 

exemple d'utilisation 351, 422, 660 

portabilite de 588 

supplanter 869 
getserv*, fonctions internes, supplanter les 824 
getservbyname, fonction 688 

exemple d'utilisation 415 

portabilite de 588 

Socket, module et 863 
getservbyport, fonction 688 

portabilite de 588 
getservent, fonction 689 

portabilite de 588 
getsockname, fonction 689 

portabilite de 588 
getsockopt, fonction 689 

portabilite de 588 
GID (groupe ID) 656,960 

effectif ($EFFECTIVE_GROUP_ID) 626, 
638 

voir dollar, $) dans les symboles 
rechercher des fichiers par 682 
reel ($REAL_GROUP_ID) 638 

voir dollar, $( dans les symboles 
voir dollar, $( et $) dans les symboles 
gid, etstat 758 
GIF 

modules Perl pour 519 
Gimp 

modules Perl pour 519 
glob, fonction 71, 72, 689 
eto 327 



exemple d'utilisation 690 

portabilite de 588 

surcharge 282 
global (variables) 960 
globales, variables 114 

controle de leur utilisation avec le pragma 
strict 121 

declaration 112, 118, 716 

local, utilisation sur 119 

predeclarer avec le pragma vars 826 

rendre locales 699 

threads, acceder aux 425 

variables de paquetage comme 267 
globalisation des noms de fichier 71 
globbing filenames 960 
globs de noms de fichiers 

portabilite de 591 
gmtime, fonction 690, 820 

exemple d'utilisation 722 

inverser 867 

supplanter 823, 868 

time, fonction 

et la fonction time 772 

utimeet 780 

voir localtime 

voir time 
Gnome 

modules Perl pour 518 
gober des fichiers 461 
goto, fonction 111, 273, 561, 691 

blocs optimises laisses de cote, utilisation 
avec des 443 

blocs optimises, utiliser avec les 559 

dump et 667 

modifications entre les versions de Perl 559 
gourmande, recherche 160, 180 
graine, nombre aleatoire 757 
graphiques 

modules Perl pour les 519 
Greenwich Mean Time (GMT) 690 
grep, fonction 571, 692 

$_et 575 

contexte vide et 571 
ecrire le votre 207 

exemple d'utilisation 204, 282, 351, 363, 
399, 413, 654 

repertoire, exemple d'utilisation avec 729 

voir map, fonction 
grep, utilitaire 174 
gros-boutiste 589,960 

ordonner avec vec 781 

trier avec pack 718 
groupes 

ID 

voir GID 
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nom pour les 682 
processus 386, 685, 743 

fonctions pour 647 

renvoyer la priorite de 686 

tuer 696 
utilisateurs 960 

fonctions pour 647 

membres, nom de login 681 

nom de groupe 682 

voir Usenet 
gt, operateur 24 

voir aussi angle droit dans les symboles 

Gtk 

modules Perl pour 518 
GUI 

voir interfaces graphiques 
guillemets doubles 127 

voir aussi apostrophes simples et doubles 
dans les symboles 
guillemets simples (') 

#index# (irrelevant) 184 
recompilation de motif et 131 
suppression de Finterpolation de variable et 
du traitement des sequences de 
traduction 173 
voir aussi apostrophes dans les symboles 
GV (valeur glob interne) 500, 960 



-h (aide), option de la ligne de commande 463 

% A H, hachage 630 

h2xs, utilitaire 502, 503, 522 

hachage 5, 8, 9, 44, 65-67, 960 

%SIG, references des gestionnaires de 

signaux 384 
affiche en ordre 104 
anonyme 

comme structures de donnees 

d'objet 291, 305 
references a 225 
au lieu de conditions en cascade, utiliser 110 
au lieu de recherches lineaires 561 
buckets 951 
cle 9,44,952 

accolades ({}), indiquer entre 11 
chemins de module (dans le hachage 

96INC) 276 
fournir des references en tant que 826 
organiser a acceder aux valeurs 

dans 251 
renvoyee par chaque fonction 646 
renvoyer avec la fonction each 668 
renvoyer des listes de 695 
suppression 349 
table de symboles 270 
trouver le nombre de 67 



d'enregistrements complexes 261 
de tableaux 252-254 

acces et affichage 253 

generation 252 
elements, donner des valeurs temporaires 

aux 699 
exists, fonction et 673 
HV (valeur hachage), typedef en C 500 
initialisation avec l'operateur x 83 
inverser 735 
liaison 349-355 

methodes de 350-355 
lier des fichiers DBM avec 661 
marque 527 

multidimensionnel 255-259 

acces et affichage 257 

generation 256 
noms de 45 

organisation des donnees de Perl a 

l'interieur de 251 
paires cle/valeur 9, 44, 65 

capture a partir d'une chaine avec 
l'operateur m//g 134 

renvoyer avec la fonction each 668 
passage par reference en entree ou sortie de 

fonction 204 
references a 223 
references comme cles 243 
renvoyer des valeurs de 780 
restreint, implementation 314 
style de sortie, changer dans le 

debogueur 490 
supprimer des valeurs dans 663 
tableaux de 254-255 

generation 254 
tables de recherche a plat, donnant acces 

a 245 

tables de symboles 269-273 

paires cle/valeur dans les 270 
typeglobs dans les 270 
traitement, fonctions pour 646 
hacker 960 
handle STDERR 18 
handle STDIN 18 
handle STDOUT 18, 19, 951 
handlers 961 
overload 320 

handler comme_chaine 323 
manquant 329 
handlers de signal, definir avec des chaines 269 
handles 5 

references a 227 
repertoires 822, 961 
handles de fichier 17, 961 
anonyme 228 
creation 18 
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dupliquer, raisons pour 713 

finissant par _TOP 215, 630 

fonctions pour 646 

formats associes, noms par defaut 213 

indirects 658,961 

lecture des donnees 69 

liaison 355-366 

handles de fichiers originaux 362 

methodes de 356-366 
lire des octets de donnees depuis 729 
localiser 67 

methodes objets pour les 822 
noms pour les 47 
open, fonction 707 
operateur angle 69 
passage 206 

passer via des IPC 394-397 

via les handles de fichiers standard 395 
pipes, fermeture explicite 711 
positionner un pointeur de fichier pour 

les 738 
pour typeglobs 67 
referencement implicite dans 223 
references a 227 
rendre locaux 700 

securite des, ou noms de fichiers 540 

selectionner pour la sortie 739 

SelectSaver, module 822 

syslog, lier la sortie a un 369 

verrous de fichiers sur les 392 
hardware devices 968 
haut de page, traitement 215 
heritage 284,961 

acces restreint et 314 

accesseurs de classe 317 

classe 266,295-303 

simple ou multiple 295 

classes de base, etablir a la compilation 825 

constructeurs 292 

implementation en pseudo-hachage et 308 
modules, de la classe Exporter 278 
par le tableau @ISA 296 
surcharge et 332 
heritage multiple 295, 961 

methodes, invocation de toutes les classes de 

base supplantees 300 
pseudo-paquetage SUPER, fonctionner 

avec 298 

sous-programme AUTOLOAD et 302 
heritage simple 295 
heure 

fonctions Perl pour 647 
modules Perl pour 517 
hex, fonction 692 
voir oct 
voir sprintf 



hexadecimal 51, 961 

convertir des nombres en 136 

specifier les nombres en 147 
hexadecimaux 692 
histoire de Perl 611 

historique des commandes du debogueur 476 
home directory (repertoire de base) 653 
HOME, variable d'environnement 471 
hosts, fichier 

voir /etc/hosts 
hotes 961 

hotes (distants), test de la joignabilite 824 
hotes, noms 

convertir en adresses 683 

obtenir depuis des adresses reseau 682 

Sys::Hostname, module 823 
HTML (Hypertext Markup Language) 

code, produire dans un format agreable 824 

generation avec le module CGI 824 

modules Perl pour 519 

pod, convertir en fichier 827 

voir CGI 

HTTP (Hypertext Transfer Protocol) 

cookies, lire et ecrire 824 

liens, recherche de 31 

modules Perl pour 519 
HV (valeur de hachage interne) 961 
HV (valeur hachage interne) 500 
hypotheques 

modules Perl pour les 520 



-I (chemin d'inclusion), option de la ligne de 

commande 456, 465 
-i (editer sur place), option de la ligne de 

commande 463 
/i (insensibilite a la casse), modificateur de 

motif 131, 134, 136 
I/O (input/output) 963 
I18N::Collate, module 822 
ICP::Open2, module 507 
identifiants 961 

GID (groupe ID) 960 

PID (processus ID) 386, 714 
deviner 541 

threads, ID de 424 

UID et GID effectifs 
reels ou 526 

se proteger contre les 534 
identificateurs 42, 47 

apostrophe simple (') dans les 52 
commencant par un souligne (_), 

modifications entre les versions de 

Perl 558 
entre accolades 53 
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modules Perl 276 
mots simples et 56 
noms vs. 47 
paquetage 267 

dans la table de symboles d'un 
paquetage 268 
segment de memoire partagee 745 
semaphores 742 

Unicode, contenant des caracteres 
alphanumeriques 377 

voir aussi GID, PID, UID 
identificateurs simples 56 
ideogrammes 33 

correspondre avec \w 378 
ideographiques, operateurs unaires 80 
idiomes, en Perl 573-582 
if, instruction 24, 27 

operateurs logiques et 23 
if, instructions 98, 100 

C, langage, differences avec Perl 556 

dans des structures case 109 
IGNORE, pseudo-signal 386 
image d'un processus 954 
imbriquees 

structures de donnees 11, 481 
impatience 961 

imperatif style de programmation 186 
import, methode 275, 280, 693, 706 

surcharge de constantes 330 
importer 113, 276 

des semantiques dans des paquetages 778 
des symboles d'un paquetage vers un 
autre 271 

sous-programmes d'un autre module 198 
voir aussi Exporter, module; exportation de 
symboles 
imprimer 

des structures de donnees imbriquees 481 
%INC, hachage 276, 630 
@INC, tableau 276, 630, 828 

ajouter des repertoires au debut de 465 

lib, pragma et 804 
inclure du Perl 828 
incrementation des variables 22 
index, fonction 693, 962 

$[et 623 

exemple d'utilisation 408 

longeur de chaine et 379 
indexer des tableaux 8, 253 
indications, compilateur 630 
indicer 561, 962 

indices de tableau negatifs 44, 560 
indirection 49, 221, 962 

entre l'utilisation d'une classe et son 
implementation 285 



voir aussi references dures ; references 
symboliques 
indirects, handles de fichiers 708 
inegalite 

voir egalite, operateurs d' ; relation, 
operateurs de 
inet_ntoa, fonction (Soket, module) 683 
inferieur a (<), operateur 87 
inferieur ou egal a (<=), operateur 87 
infinies, boucles 103 
INIT, blocs 436 

initialisation de variables avant l'appel de 
sous-programme 203 

ordre d'execution 451, 454 
init, programme 686 
initiale majuscule 

ucfirst, traduire en 379 
initialisation 

de variables avant d'appeler des sous- 
programmes 203 

debogueur, personnaliser avec des fichiers 
d'initialisation 487 

expressions 102 

objets 293 

tranches de tableaux et de hachages 83 

variables de hachage 66 
inode, et stat 758 
$INPLACE_EDIT 631 
$INPUT_LINE_NUMBER 631 
$INPUT_RECORD_SEPARATOR 460, 632 
inserer Perl 499, 507-512, 962 

ajouter un interpreteur Perl a un 
programme C 508 

compiler des programmes inseres 508 

evaluer une instruction Perl depuis C 510 

pile de Perl, manipuler depuis C 511 
installation 

modules supportant 1' 827 

modules, de CPAN 520 

dans la bibliotheque Perl 521 
installes, inventaire des modules 828 
instances 283, 962 
instruction unless 27 
instructions 97-122 

boucles 

voir boucles 

composees 99 

declarations globales et 112 

etiquettes pour 
voir etiquettes 

if et unless 100 

operateurs de controle de boucle contre 107 
pendant 962 

Perl, evaluer depuis C 510 
simple 97 
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instructions iteratives 28 

boucle for 29 

boucle while 28 

instruction foreach 29 

instruction until 28 
instructions pendantes 962 
int, fonction 693 

exemple d'utilisation 728 
integer, pragma 82, 803 

exemple d'utilisation 791 
intercepter 

des signaux 385 

erreurs de depassement en memoire (out-of- 
memory) 634 
intercepter des signaux, gestionnaire pour 385 
interfaces 284,962 

semantique d'octet ou de caractere dans 
les 375 
interfaces graphiques 

modules Perl pour les 518 

Perl/Tk 

en utilisant Perl/Tk 568 
interfaces utilisateurs, modules fournissant 

des 825 
internationalisation 41, 593 

donnees textuelles avec Unicode 373 

modules Perl pour 1' 518, 822 
internes 

appel de methodes surchargees 298 
fonctions 

lister par type 827 

prototyper les sous-programmes pour 

emuler 205 
semantique de caracteres, manipuler 

la 376 
surcharge 281-282 
types de donnees 43-45 
Internet clients/serveurs TCP 411 
Internet, modules CPAN pour les services 410 
interpolation 

de conditions dans des motifs 194 
de motifs lors de la recherche 193 
interpolation de variable 6, 53, 962 

controle de detection de motif avec 172-176 
dans des guillemets doubles 127 
dans les chaines entre guillemets 20, 53 
en utilisant l'operateur de globalisation 73 
fonctions et 348 
motifs et 127 
references arrieres 36 
valeurs d'une liste 63 
valeurs de tableau 56 
valeurs scalaires 51 
interpreter, Perl 16, 443, 445, 963 
acceder depuis C 507,508 



compilateur, interactions avec 450-454 

integrer dans des applications 446 

invoquer avec une ligne #! (shebang) 456 

multiples, lancer 445 

persistant 507 
interpreters 5 

de commandes 455 

isolement (quotation) sur les systemes 
non-Unix 459 

destruction d'objet a la terminaison 304 

threads 418 
interruption, gestionnaire pour les signaux 

d' 385 

intersection d'ensembles 204 
intervalle (.. et ...), operateur 90 
intervalles 

caracteres 148 

jeux de caracteres, specifier dans 139 
ints 721 

inverser des instructions print et printf (handles 

de fichier lies) 355 
inverser des tableaux et des hachages 735 
invocation de methode explicite 286 
invocation de methode implicite 286 
invoquant 285 
invoquer 

voir executer 
IO (Internal I/O object) 963 
IO (internal I/O object) 

voir aussi objets indirects 
IO::*, modules 519 
IO::Dir, module 822 
IO::File, module 822 
IO::Handle, module 822 
IO::Pipe, module 822 
IO::Poll, module 822 
IO::Pty, module 403 
IO::Seekable, module 822 
IO::Select, module 822 
IO::Socket, module 410, 823, 854 
IO::Socket::INET, module 411, 823 
IO::Socket::UNIX, module 823 
ioctl, fonction 694 

determiner la taille de la fenetre avec 867 

exemple d'utilisation 694 

h2phet 790 

portabilite de 588 

valeur de retour 694 
IP (Internet Protocol) 409, 963 

adresses 

noms de reseau et 685 
UTF-8, representation des 375 
utiliser la notation v-chaine pour 683 
IPC (interprocess communication) 383^116 

entre processus sur la meme machine 384 
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fichiers 390-397 

modules pour 822 

pipes 397-405 

bidirectionnelle 402-404 

portabilite et 592 

signaux 384-390 

sockets 409-416 

clients en reseau 411 
passage de message 415 
serveurs en reseau 412-414 

sur Plnternet 383 
IPC System V 405-409 

appels systeme 383 

manque de fiabilite des signaux 388 

fonctions pour 647 

fonctions pour les semaphores 741 

IPC::SysV, module 824 

memoire partagee, fonctions pour la 744 

messages, appels systeme pour les 703 

portabilite des 592 

tuer des groupes de processus 696 
IPC::Open2 824 
IPC::Open2, module 856 
IPC::Open3, module 507, 824, 856 
IPC::Semaphore, module 824 
IPC::Shareable, module 406 
IPC::SysV, module 824 
isa, methode (paquetage UNIVERSAL) 299 
©ISA, tableau 295, 633, 891, 931, 941 

heritage avec 296 

use base, pragma et 794 
isolement (quotation), marques 

chaines 

changer le style d'affichage des 
chaines 490 
non-Unix 

sur les systemes non-Unix 459 
iteration 963 

voir aussi boucles 
voir boucles 
ithreads 418 

API Perl pour les 445 
itimer, routines 649 
IV (valeur entiere interne) 500, 963 

J 

JAPH (Just Another Perl Hacker) 963 

Java, modules Perl pour 517 

jeux 

modules Perl pour les 520 
jeux de caracteres 
ASCII 

voir ASCII 

ordre et intervalles de caracteres dans 139 
portabilite des 593 



Unicode 373-381 
join, fonction 695 
efficacite de 565 

exemple d'utilisation 56, 138, 236, 753 

packou 722 

split ou 754 

voir aussi split 
join, methode (Thread, module) 422 

capturer des exceptions depuis 423 
journaux, fichiers 

modules Perl pour les 519 
justification 214 
justification a droite 217 
justification a gauche 217 

K 

-k (sticky), test de fichier 85 
keys, fonction 11, 37, 67, 695 

etourderies courantes avec 559 

exemple d'utilisation 204, 253 

hachages lies et 354 

pour compter les entrees dans un 
hachage 698 

voir each, fonction ; values, fonction 
kill, fonction 384,696 

exemple d'utilisation 387 

faire l'inventaire des signaux 386 

Microsoft, systemes et 387 

portabilite de 588 

traitement de END et 453 

L 

-1 (fin de ligne automatique), option de la ligne 

de commande 465 
-1 (lien symbolique), test de fichier 85 
langage assembleur, Perl comme 18 
langage BASIC, operateurs logiques du 23 
langage C 

preprocesseur 970 
langage rassembleur, Perl comme 963 
langages 

artificiels 4 

informels 42 

naturel vs. artificiel 4 

naturels 4 

variables d'environnement controlant la 
gestion de Perl pour les 471 

traduire 585 

verifier des caracteres pour 154 
langages de programmation 

modules Perl pour s'interfacer avec des 518 
larges, API de caracteres 

activer l'utilisation par Perl sur le systeme 
cible 461 

appels systeme utilisant des 375 
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last, operateur 30, 103, 106, 110, 564, 571, 576, 
697 

contrdles de boucle et 108 

exemple d'utilisation 105 

utilisation dans un do while 109 
@LAST_MATCH_END 633 
@LAST_MATCH_START 633 
$LAST_PAREN_MATCH 634 
$LAST_REGEX_CODE_RESULT 634 
lc, fonction 697 

exemple d'utilisation 37, 101, 111, 128 

trier avec 748 
lcfirst, fonction 698 
le, operateur 24 

voir aussi angle gauche dans les symboles 

voir aussi It, operateur 
length, fonction 698 

enrobages orientes octet pour 377 

exemple d'utilisation 85 

poset 725 

positions de caracteres et 379 
less, pragma 804, 826 
lexeur 963 
lexicale, analyse 500 

dans le compilateur Perl 438 
lexicales, variables 704 

aflficher avec B::Showlex 829 

stockage dans les piles de memoires de 
travail lexicales 445 

threads, acceder aux 425 
lexicalisation 12 
lexicaux, avertissements 

$ A W et 470 

${ A WARNING_BITS} 641 
liaison 964 

operateurs (=~, !~) 32, 81, 127 

variables et paquetages 335 
lib, pragma 276, 804, 828 
liens 956,963 

HTTP, recherche de 31 

hyperliens 

voir aussi CGI 
voir aussi HTML 
voir aussi HTTP 

voir liens symboliques 
liens en dur (vers des noms de fichiers) 698 
liens symboliques 763 

lstat, fonction et 701 

obtenir les noms de fichiers depuis 731 

risques de securite dans Unix 537 

voir symlink 
liens, nombre et stat 758 
lier 

fichier DBM avec hachage 661 
Tie::Array, module 826 



Tie::Handle, module 826 

Tie::Hash, module 826 
lier des variables 243, 335-369 

hachages 349-355 

handles de fichier 355-366 

piege de deliement 366-368 

scalaires 337-344 

tableaux 344-349 
LIFO (Last In, First Out) 964 
ligne 

vidage du tampon par 636 
ligne de commande 

apparence a l'ecran de la 489 

appel de l'interpreteur depuis la 16 

modules Perl pour editer 518 

modules pour le traitement de la 821 
ligne de commande, options 

voir options 
lignes 964 

assertions de limite 161 
lignes de continuation 107, 629 
lignes images 214, 680 
lignes vides, valeur booleenne des 28 
lignes, compteur 

voir $., variable 
lignes, numeros de 

du fichier d'entree 584 
limite, creation de tableau 345 
limites de mot 

voir \b and \B assertions 
line numbers 966 
#line, directive 584 
__LINE_, token 59, 584 
Linelnfo, option du debogueur 489 
link, fonction 698 

portabilite de 588 

voir liens symboliques 

voir symlink 
lint (verificateur de programmes C) 449 
lire 

dans des fichiers, mode d'ouverture et 710 

des donnees via des appels systeme de bas 
niveau 767 

ID d'un segment de memoire partagee 745 
lisible, operateur de test de fichier 85 
$LIST_SEPARATOR 634 
liste de mots 63 
liste, contexte 

evaluer des expressions dans le 
debogueur 481 

fonctions dans un 645 

forcer un contexte scalaire au lieu d'un 737 

operations se comportant differemment 
dans un 555 

reconnaitre dans le debogueur 477 
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listen, fonction 698 

exemple d'utilisation 412 

portability de 588 
lister du code 482 
listes 8,37,60,99,964 

affectation 64 

convertir en scalaires 11 

des threads courants dans le processus 424 

emboitements de 245 

en tant qu'arguments de fonctions 643 

enregistrements ordonnes dans un 
tableau 251 

interpolation 63 

listes, LISTE 62 

map, fonction et 702 

mise a plat 643 

nulles 63,964 

renverser 735 

replication avec l'operateur x 82 
scalaires, retour de fonction et valeurs de 

parametres 199 
tableaux vs. 62-65 
traitement, fonctions pour 646 
trier 747 

tronquer avec chop 655 

voir aussi tableaux 
listes non ordonnees 

voir hachage 
litteraux 124,964 

chaine 50 

numeriques 50, 51 

pseudo-litteraux 

voir operateurs d'entre 

UTF-8, permettre l'utilisation dans les 377 
little-endian 

voir petit-boutiste 
local 964 

affectation d'un gestionnaire de signaux 386 

handles de fichiers 67 

variables 

voir declarations local 
local, declarations 

erreurs de programmation courantes 

avec 555 
my ou 556 

sauvegarder les valeurs internes des 444 
local, fonction 699 
locale, pragma 806, 822 
locales 

declarations, comparaisons de chaines et 88 
locale, pragma avec les classes de caracteres 

POSIX 158 
modules et pragmas pour les 518, 822 
point decimal dans les formats 214 
raccourcis de classes de caracteres Perl 

et 149 



Unicode et 697 
localisation 

voir locales 
localtime, fonction 700, 820 

exemple d'utilisation 64, 303, 835 

File::statet 759 

inverser 867 

strftimeet 859 

supplanter 823, 868 

time, fonction 

et la fonction time 772 

voir gmtime 

voir time 
lock, fonction 426-431, 701 

exemple d'utilisation 537 

references comme arguments de 223 
locked, attribut de sous-programme 210, 315, 

429 

log (logarithme), fonction 701 

complexes, nombres et 857 
LOGDIR, variable d'environnement 471 
logiciel a source ouvert 964 
login 

fonctions pour 647 
login, noms 

gergrnam, fonction renvoyant 682 

getgrent, fonction 681 

getgrid, fonction renvoyant 682 

getlogin, fonction pour 684 

logs 

voir journaux, fichiers 
longs 721 
longueur 

d'une chaine detectee 160 

d'une correspondance 633 

de chaines 698 

de chaines Unicode 377, 379 

des chaines dans les motifs 563 
lstat, fonction 701 

_ et 87, 623 

portability de 588 

supplanter 821 

voir liens symboliques 

voir stats 

voir symlink 
It, operateur 24 

voir aussi angle gauche dans les symboles 

voir aussi le, operateur 
lvalues 44, 46, 966 

?: et 93 

efficacite des 577 
identifier avec ref 732 
lvalue, attribut de sous-programme 211- 
212 

methodes, declarer pour indiquer un retour 
de 314 
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modificateurs et 115 
operateurs d'affectation et 93 
operateurs et 21-22 
references et 79 
sous-programmes et 47 
utilisation d'operateurs de recherche de 
motif sur 128 



-M (date de modification) operateur de test de 

fichier 86, 87, 625 
-M (use module), option de la ligne de 

commande 466 

blib, pragma et 795 
-m (use module), option de la ligne de 

commande 466 
/m, modificateur de motif 130, 134, 136 
mil (correspondance), operateur 61, 483, 554, 

701 

pos, fonction et 725 
mil (match), operateur 124, 133-135 
=~, utilisation avec l'operateur de 

liaison 128 
fournissant interpolation en guillemets 

doubles 127 
modificateurs pour 130, 133 
m//g, modifications entre les versions de 
Perl 560 

m?? (correspondance), operateur 483 

reset, fonction et 734 
m??, operateur 135 
machine virtuelle, Perl 443, 445 
Macintosh, systeme d'exploitation 

File::Spec::Mac, module 821 

invoquer des applications Perl sur 458 

isoler (quoting) sur 459 
MacOS 

interface de la ligne de commande sur 16 
magique 964 

magique, autodecrementation et auto- 
incrementation 80, 91, 325, 342 
mail 

envoyer, portabilite et 592 

modules Perl pour le 519 
main, paquetage 267 
majuscules 

convertiren 52, 135 

dans les noms de modules 819 

uc et ucfirst, fonctions 773 
majuscules/minuscules 

changer 140 

conversion en majuscules (\u) 135 
dans les noms de module 276 
noms d'etiquette 101 
noms de methode, variables liees 337 
noms de sous-programme 198 



Makefile 964 

creer pour les extensions Perl 828 
Makefile.PL 503, 520, 522 
MakeMaker 522 
malloc 

erreurs 634 

PERL_DEBUG_MSTATS, variable 

d'environnement, utilisation avec 472 
man, commande xix, 275, 486, 964 

voir aussi perldoc 
man, pages de xix, 968 

Pod::Man, module 827 

voir aussi pages de manuel 
MANIFEST, fichier 503, 828 
map, fonction 37, 571, 702 

contexte vide et 571 

exemple d'utilisation 37, 175, 262 

mise en majuscules avec 357 

transformation schwartzienne et 750 

voir grep, fonction 
marquage 

fonctions retournant une donnee 
marquee 648 
marquage, verification 414, 469, 526 

-D et 462 

activer avec -T 527 

CGI, programmes et 547 

code interpole et 550 

definie 525, 527 

File::Globet 847 

handles de fichiers, supprimer pour les 853 

marquage, mode 526 

motifs et 192,808 

PERL5LIB et 472 

programmes exigeant une 526 

Safe, compartiments et 547 
marques d'interpolation 

chaines 7 
marques de protection 6 

chaines et 52 

contexte interpolatif 61 

dans les accolades 53 

enleverles 55 

operateurs de protection 54 

valeurs false 958 
marshalling (formatage de presentation), 

modules de 838 
masques de bits 740 
$MATCH 635 
Math::BigFloat, module 820 
Math::BigInt, module 319, 820 
Math::Complex, module 820 
Math::trig, module 820 
mathematiques 

bibliotheque (C, langage) 506 

fonction mathematiques, surcharge 326 
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modules Perl pour les 517 

operateurs 19, 75 
maximale, detection 142, 159 
memoire 965 

depassements 634 

efficacite de la 566 

gestion, destructeurs et 303 

ID d'un segment de memoire partagee 745 

ramasse-miettes 244 

statistiques sur la, afficher 472 
memoire partagee, IPC System V 

acces controle a la 406 

fonctions pour la 744 
messages 

afficher a Pentree et a la sortie des sous- 
programmes 489 

envoyer sur des sockets 742 

fonctions pour les 703 

IPC::Msg, module 823 

passer avec UDP 415 

recevoir sur des sockets 731 

script inclus dans des 470 
messages d'avertissement 

intercepter 639 
messages warning 

-w, affichage avec 17 
mesure du temps 

avec des alarmes 649 

comparer les temps d'execution de sous- 
programmes 495-498 

temps d'execution de versions differentes de 
code, comparer 831-833 
metacaractere \s (espace) 32 
metacaractere \w (mot) 32 
metacaracteres 124, 965 

dans des motifs 141-148 

dans les arguments de exec 671 

echappement avec quotemeta 728 

protection avec des antislashs (\) 141 

shell, dans les commandes pipees 711 

structured 125 

system, fonction 566 
metacaracteres structuraux dans les expressions 

rationnelles 125 
metasymboles 965 

alphanumeriques, dans des motifs 143 

dans des motifs 141-148 

syntaxe d'extension pour 143 
metasymboles jokers 147 

classes de caracteres et 148, 149 
metasymboles structurels 141 
meteo 

modules Perl pour la 520 
Method (dans le pragma overload) 332 
method, attribut de sous-programme 210, 315 
methode importer 962 



methodes 233, 283, 965 

ajout a une classe existante 299 
appelees par des variables liees 337 
autochargement 301 

de donnees de classe, fonctionnant comme 

des accesseurs 316 
de liaison de hachage 350-355 
de liaison de tableaux 345-348 
declarations, indiquant le retour de 

lvalues 314 
heritage avec les classes Perl 305 
invocation 285-291 

appels de sous-programme ou 292 

explicite ou implicite 286 

utilisant l'operateur fleche 287 

utilisant les objets indirects 288-291 
liaison de scalaires 338-342 
methodes privees, ignorer l'heritage 

avec 302 
noms de 572 
pour les hachages lies 349 
pour les handles de fichiers lies 355 
pour les tableaux lies 344 
recherche de 

heritage de classe 295 

heritage par le tableau @ISA 296 
references a 239 
sous-programmes comme 285 
sous-programmes contre 197 
sous-programmes et 286 
surcharge 297 
UNIVERSAL, classe 299 

ajout a 301 
verrouiller (methodes d'objet) 429 
methodes accesseurs 293 
creation 305 

generation par autochargement 309 
generation par fermetures 311 
methodes de donnees de classe, 

fonctionnant comme 316 
pseudo-hachages et 307 
methodes d'acces 965 
methodes d'instance 283 

references d'objets comme invoquants 
de 285 

methodes de classe 283, 965 
constructeurs comme 292 
noms de paquetage comme invoquants pour 
les 285 

methodes supplantees (classe de base), 

invocation de toutes les 300 
methodes:Thread, classe 421 
Microsoft Windows 

ActiveState, distribution de Perl, 
installer 458 
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appels systeme utilisant des API de 

caracteres larges 375 
File::Spec::Win32, module 821 
fork et clonage d'interpreteurs sur 418 
globs de fichiers avec File::DosGlob 821 
informations sur le portage (perlwin32) 384 
isoler (quoting) sur NT 459 
modules de CPAN, installer sur 520 
modules Perl pour 519, 830 
registre, manipulation de 335 
shell, positionner une possibility a l'usage de 

Perl 472 
signal numero 0 sur 387 
Win32::Pipe, module 404 
MIDI 

modules Perl pour 520 
MIME 

modules Perl pour 519 
minimale, recherche 142, 159 
minuscule, conversion en 52 
minuscules, mise en 

lc et lcfirst, fonction 697 
minuter les operations lentes 389 
mise au point 

voir debogage 
mise en ligne des fonctions constantes 208 

empecher 209 
mkdir, fonction 702 

exemple d'utilisation 573 

ou mkdir, appel systeme 565 
mkfifo, fonction 404 
MLDBM, module 368 

Data::Dumper, utiliser avec le module 838 
mod_perl 445, 507 
mode autosplit (avec selecteur -a) 949 
mode par enregistrement 632 
mode par paragraphe 632 
mode, et stat 758 

modes, ouvrir des fichiers avec des 709 
modifiable, operateur de test de fichier 85 
modificateurs 
instructions 

quantificateurs contre 126 
simples 98 
motif 130-133 
cloitre 168 

mil (match), operateur 133 
s/// (substitution), operateur 136 
trl/l (transliteration), operateur 139 
modification, date pour un fichier 758, 780 
modules xv, 12, 266, 275-282 
casse des 47 
classes ou 266 

classes, stockage pour espace prive 303 
CPAN 13,516 



categories de 517 
construire 521 
creer 522 

decompresser et depaqueter 520 

installer dans la bibliotheque Perl 521 

mail, envoyer 592 

portability des 592 

rendre accessibles depuis un 
programme 520 

repertoire pour les 515 

stockage dans le 266 
creation 277-281 

espace prive et Exporter 278-281 

verification de version 280 
diviser en plusieurs fichiers 274 
empecher l'export de symboles 280 
exporter les noms vers d'autres modules 693 
fonctions internes, supplanter 281-282 
fonctions pour 647 
importer 828 

modules tie sur CPAN 368-369 
noms de 572 
sorties (backends) 446 
standards 819-870 

acces oriente objet aux fichiers, aux 

repertoires et aux IPC 822 
avertissements et exceptions 827 
bibliotheques de gestion des fichiers 

DBM, chargement des 824 
classes de base et facilites 826 
communication reseau et inter- 

processus 823 
compilateur Perl et generateur de 

code 829 
interfaces du systeme d'exploitation, 

manipuler 823 
interfaces utilisateurs, fournissant 
des 825 

internationalisation et locales 822 
langage Perl, extensions et mecanismes 

internes 825 
securite, s'occupant de 825 
support d'installation 827 
support de developpement 829 
support de documentation 827 
texte, manipulation avec 820 
traitement de la ligne de 

commande 821 
types de donnees 820 
web 824 

systeme de classes et 297 

tester 503, 506, 523 

thread modules de 431 

thread, securite et 420 

voir aussi paquetages 
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modules centraux, Perl 517 
modulo (%), operateur 82 
moins (-), operateur 80 
Mongueurs de Perl xxv 
motifs (et expressions regulieres) 30-36, 123- 
195 

alterer le comportement par defaut des 826 

apostrophes dans les 54 

approche declarative dans 187 

assertions dans 125 

assertions, definir vos propres 194 

autosplit via l'option -a 463 

capture et regroupement dans 164-168 

caracteres dans 124-126 

caracteres, correspondre a des, au lieu 

d'octets 378 
classes de caracteres 32, 148-158 

confusion avec les index de tableau 56 
code Perl a l'interieur de 187 
controle de la detection 170-183 

compilateur de regex 176 

controle de flux Perl, decider de 
Pexecution d'un motif 170 
correspondance 

operateurs de 31 
correspondance avide 34 
correspondance minimale 34 
debogueur, commandes pour la 

correspondance 483 
delimiteur de fin pour 127 
detection de motifs 

$', $&, $', variables et 130, 135 

operateurs pour 126-141 

sous-chaines correspondant a des sous- 
motifs 129 
evaluation de code au moment de la 

recherche 190 
evaluation de substitution 189 
fonction split et 128 
fonctions pour la recherche 646 
generes 187 

gourmande, recherche 180 
grep, fonction et 692 
interpolation conditionnelle dans 194 
interpolation de motifs lors de la 

recherche 193 
metacaracteres et metasymboles dans 141- 

148 

metasymboles 146 
metasymboles alphanumeriques 143 
modificateurs 130-133 

cloitre, pour un 168 
modifications entre les versions de Perl 559 
motifs personnels 183-195 
positions pour la detection 161-164 



pour rendre des donnees non marquees 530 

precedence de la detection 178-183 

proprietes Unicode, correspondre aux 378 

quantificateurs dans 126, 142, 158-161, 180 

recherche recursive 193 

references arrieres 36, 164 

regroupements dans 167 

soucis de securite 550 

split, fonction et 752 

study, fonction 759 

style de programmation pour 186 

syntaxe d'extension 143 

assertions peripheriques 183-185 

trouver les doublons dans des 
paragraphes 132 

voir mil, operateur m??, operateur 
motifs generes 187 
mots 965 

capture 134 

listes de, realiser une completion 

programmable par commande sur 
des 825 
mots cles 

voir mots reserves 
mots de passe 757 

crypt, fonction et 660 

modules Perl pour les 518 

passwd, fichier 687 
mots reserves 47 

mots simples, conflits possible avec 55 
mots simples 

eviter, raisons pour 556 

modifications entre les versions de Perl 558 

verification de leur utilisation avec le 
pragma strict 122 
MS-DOS, systeme d'exploitation 

invoquer des applications Perl avec 458 
msgctl, fonction 703 

portabilite de 588 
msgget, fonction 703 

portabilite de 588 
msgrcv, fonction 703 

portabilite de 588 
msgsnd, fonction 703 

portabilite de 588 
multidimensionnels, hachages 255-259 

acces et affichage 257 

generation 256 
multidimensionnels, tableaux 245-252 
multiplicatifs, operateurs 82 
multiplication 20 

chalne, operateur de repetition 20 
multiprocessus 

processeur, acces imprevisible au 536 
multithread 417 
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my, fonction 48, 97, 104, 114, 115, 116 
affectation de listes 64 
declaration 704 

fermetures et 237 

voir local, declaration ; our, declaration 
efficacite de 564 
etourderies courantes avec 555 
exemple d'utilisation 202 
local contre 120 
local ou 556 
our vs. 48 
paquetages et 267 
regies des contextes et 60 
variables de boucle et 101 
voir portee lexicale ; local, declarations ; our, 

declarations 



\n 

voir sauts de ligne 
-n (boucle implicite), option de la ligne de 
commande 466 
voir -p 

NDBM_File, module 825 
ne, operateur 24, 554 

voir aussi point d'exclamation dans les 
symboles 
negation 

classe de caracteres 34 
classes de caracteres 148, 149 
classes de caracteres POSIX 157 
operateur (!) logique 80 

surcharge 324 
operateur ~ sur les bits 80 
operateur arithmetique (-) 80 
voir aussi point d'exclamation dans les 
symboles 

negatives de prevision, assertions 180, 183 
negatives de retrovision, assertions 184 
Net::hostent, module 824 

Class::Struct, utiliser pour creer des objets et 
des accesseurs 835 
Net::netent, module 684, 824 
Net::Ping, module 824 
Net::proto, module 686 
Net::protoent, module 824 
Net::servent, module 824 
networks, fichier 

voir /etc/networks 
new, methode 421 
news 

voir Usenet 
next, operateur 30, 101, 106, 706 

dans un do {} while 109, 557 

next if, construction 562 



sortie de blocs a usage unique avec 108 
NFS (systeme de fichiers en reseau) 966 

limitation de 409 
\NNN, metasymbole 146 
no, declarations 112, 277, 342, 707 

voir aussi pragmas 
nom absolu 47 
nom de variables 

dans les tables de symboles imbriquees 48 
nom/numero, conversion 686 
nombre en virgule flottante 966 
nombres 5 

aleatoires 728, 757 

chaines, conversion en 50 

chiffres dans les noms 47 

conversion de variables non numeriques 
en 323 

entiers 

voir entiers 

fonctions pour 646 

hexadecimaux 136, 692 

justification sur le point decimal 214 

metacaractere \d (digit) 32 

octaux 51, 707 

operateurs de comparaison pour les 24 

operateurs sur les bits, travailler avec 89 

souligne dans les 51 

tableau, memoriser dans un 8 

tailledes 589 

tronquer avec int 693 

typage en Perl 50 

valeur booleenne des 26 

virgule flottante 

voir nombres en virgule flottante 

virgules, inserer dans 217 
nombres aleatoires 

produire avec des handles ou des 
scalaires 365 
nombres en virgule flottante 50 

Math::BigFloat, module 820 
nombres octals 51 
nomethod, clef de surcharge 329 
nommes 

caracteres 52 
inserer 377 

metasymboles pour 147 
pipes 404 
tubes 978 

unaires, operateurs 83-85 
listede 83 
noms 5, 46-50 

adresses reseau, obtenir depuis des 682, 684 
attribut 211 

classes, a distinguer des sous- 
programmes 290 
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commandes 14, 966 
constructeurs 293 

convention des majuscules en Perl 47 
convertir en adresses reseau 685 
de fichiers temporaires 541 
de format 

voir formats ; declarer 
de format associes a un handle de 

fichier 213 
de modules/packages 572 
de signaux 386 
de sockets 650 
de variables 5, 45, 572 
des systemes d'exploitation 635 
du programme 

voir dollar, $0 dans les symboles 
etiquette et filehandle 47 
fichier 

voir noms de fichier 
fonction 14 
groupes 682 
hachage 45 

hachage, memoriser dans un 8 
hotes, convertir en adresses reseau 683 
identificateurs vs. 47 
login 

voir login, noms 
methodes, variables liees 337 
modules 276 

majuscules/minuscules dans 276 
ordinateur 

voir nom d'hote 
paquetage 268 

gestion 13 
parametres ne necessitant pas de 200 
ports, obtenir depuis des numeros 688 
protocoles 

convertir vers/depuis les numeros 686 

obtenir depuis des numeros de 
ports 688 
recherche des 48-50 
restreindre a une portee 115 
sous-programme 47, 198 

mise en majuscules de 198 
table de symboles 269 
tableau 45 
typeglob 67 
noms d'hotes 

convertir en adresses 685 
noms de base, fichiers 821 
noms de fichier 59, 966 

& (esperluette) dans les 712 

donnees externes dans les, risques de securite 

des 533 
expansion des 689 



globalisation 71 

voir aussi fonction glob 
globs de 591 
hachage 96INC des 630 
lier avec des liens en dur 698 
modes d'ouverture 710 
modifier 733 

obtenir depuis des liens symboliques 731 

visualiser un programme ou une instruction 
eval different 483 
noms de variables internes, Perl 47 
noms indefinis, recherche des 48 
non interactif, mettre le debogueur en 

mode 491 
not (!), operateur 80 

voir aussi point d'exclamation dans les 
symboles 
notation exponentielle 51 
notation shebang 

voir #! dans les symboles 
nouvelle ligne 42 

enlever 19 

ligne blanche, valeur booleenne et 28 
noyau 

Unix, bogue des scripts set-id dans le 537 
noyaux 

fiabilite des signaux dans les 388 
fossoyer automatiquement les processus 

zombies 387 
generer des signaux 384 
threads et 419 

nul 

handle de fichier 70 
nulle 

liste 63, 65 

valeurs 964 
numeros 

commandes, historique pour le 
debogueur 476 

de lignes (symbole __LINE__) 59, 584 

de protocole 686 

ports, obtenir les noms de protocole 

depuis 688 
pour les pages 630 
numeros de lignes 59 

dans le fichier en entree 631 

voir dollar, $. dans les symboles 
NV (valeur double interne) 500 



-o (UID effectif), test de fichier 85 

-O (UID reel), test de fichier 85 

/o (une seule fois), modificateur de motif 131, 

134, 136, 146, 172 
O, module 447, 449, 830 
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objets 12,283-318,978 
classes 266 

gestion de donnees de classe 315-318 
consacrer 79 
consacres (avec bless) 651 
constructeurs 291-295 

heritables 292 

initialisation 293 

voir constructeurs 
conversion en chaines 236 
destructeurs d'instance 303 

ramasse-miettes avec 304 
destruction (globale), controler 472 
donnees d'instance 

generation d'accesseurs par 
autochargement 309 

generation d'accesseurs par 
fermetures 311 

generation de classes avec 
Class::Struct 309 

gestion 304-315 

nouvelles fonctionnalites, Perl 5.6 314 

objets prives, utilisation de fermetures 
pour 312-314 
fonctions pour 647 
heritage 295-303 

par le tableau @ISA 296 
indirect 

voir objets indirects 
methodes 233 

references a 

voir fermetures 

threads 421 

verrouiller 429 
references a, dans les scalaires 7 
stockage dans d'autres objets compare a 

l'heritage 304 
systeme objet de Perl 285 
variables liees, sous-jacentes 336 

rompre les references aux 367 
objets indirects 967 

ambiguites avec les 288-291 

chemin explicite, passer dans l'emplacement 

des 529 
definition 288 
exemple d'utilisation 260 
Oct, fonction 51, 707 

chmod, utilisation avec 654 
exemple d'utilisation 51 
voir hex 
voir sprintf 
octaux, nombres 707 

caracteres, representer 146, 374 
specifier $/ comme 460 



octets 41,967 

caracteres ou 373, 645 
lecture 729 
lire 767 

operateurs de decalage de bits 83 
places memoires 

voir gros-boutiste ; petit-boutiste 

ODBC 

modules Perl pour 519 

offsets 955 

$OLD_PERL_VERSION 635 
OLE 

modules Perl pour 519 
one-liner, script 16, 967 
OO 

voir programmation orientee objet 
Opcode, module 825 
opcodes 

voir codes d'operation 
open, fonction 18, 399, 707 

$. et 658 

$*Fet 641 

binmode et 650 

convertir un descripteur de fichier en handle 

de fichier 396 
fichiers temporaires et 541 
FileHandle, module ou 851 
fileno, fonction et 676 
fork-open 399, 712 

voir fork, fonction 
handles de fichier lies et 356 
liste de fichiers et 228 
modes dans la forme a trois arguments 709 
open, pragma et 807 
Open2 et Open3 ou 402 
passer des handles de fichiers avec 395 
pipee 

forme a deux arguments 712 

forme avec un argument de liste, eviter 

le shell avec 549 
risques de securite poses par 533 

pipes nommes et 405 

portabilite de 588, 591, 592 

securite et 527 

serveurs en reseau et 413 

set-id, programmes et 534 

sur un pipe 398 

sysopen ou 765 

verrouillage de fichier et 392 

voir sysopen 
open, pragma 807 

Open2, Open3, modules de bibliotheque 402 
opendir, fonction 716 

voir readdir 
operandes, pile d' 444 
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operateur 731 

operateur adresse-de (en C) 967 
operateur angle (<>) 18, 69, 463, 556 
ARGVet 625 

avec les handles de fichier lies 357 

utilisation de la globalisation au lieu de F 72 
operateur arithmetique 967 
operateur circonfixe 967 
operateur d'auto-incrementation (++) 22, 949 
operateur d'autodecrementation ( - - ) 22 
operateur de concatenation (.) 20 

exemple d'utilisation en affectation 22 
operateur de correspondance de motif 32 
operateur de globalisation 71 
operateur de lecture de ligne 18 
operateur de ligne de commande 

voir operateur d'execution de commande 
(backtick) 
operateur de repetition (x) 20 
operateur de test en ecriture 25 
operateur de test en lecture 25 
operateur iteratif, surcharge 327 
operateurs 19, 75-96, 967 

acces, restreindre avec le module Safe 546 

associativite de 75 

C(langage) 96 

d'affectation 21-22 

de protection 54 

de recherche et de substitution 124 
detection de motif 126-141 

modificateurs pour 130-133 
guillemets, equivalence syntaxique des 7 
les verbes comme 14 
logiques 23 

positions ou longueurs dans Unicode 379 
pour le controle de boucle 106 
precedence 75 

conserver la precedence de C en Perl 77 
precedence de 20 
sur les chaines 20 

surchargeables 77, 319-333, 820, 975 
d'affectation 325 
de comparaison 326 
de conversion 323 
de dereference 327 
de negation logique 324 
iteratif 327 

operateurs arithmetiques 324 
references circulaires, problemes 

avec 328 
sur les bits 325 
operateurs additifs 83 
operateurs arithmetiques 80 
binaires 20, 80 
ordre devaluation 20 
surcharge 321, 324 



operateurs binaires 19, 967 
operateurs court-circuit 

voir operateurs logiques 
operateurs d'affectation 21-22, 44, 947 

valeurs, retour de 22 
operateurs de comparaison 24 
operateurs de liste 75, 77, 95, 967 

distinguer des operateurs unaires 84 
operateurs de mutation, copie et 328 
operateurs de postincrement et 

postdecrement 22 
operateurs de preincrement et predecrement 22 
operateurs entree de ligne 

voir operateur angle 
operateurs infixes 19, 962 
operateurs logiques 23, 95, 967 

et (&&), operateur 89 

negation (!), operateur 80 

ou (||), operateur 89,170 

utilisation avec les operateurs de 
liste 113 

precedence des 289 

separation de processus, pere et fils 418 

surcharge 324 
operateurs prefixes 19 
operateurs sur les bits 75-96 

surcharge 320 
operateurs ternaires 19 
operateurs unaires 19 

arithmetique 22 

booleen 25 

nommes 73 

operateurs sur listes, distinguer des 59 
operations, contexte et 59 
ops, pragma 825 
optimiser 

dans le compilateur Perl 438 

performance et 561 
options 

modules Perl pour le traitement des 518 
options, ligne de commande 456, 460-471 
-, option 460 
-0, option 456, 460 
-a, option 461, 629 
-C, option 461 
-c, option 461 
-D, option 462 
-d, option 461, 475, 494 
-e, option 456, 463 
-F, option 461, 463 
-h, option 463 
-I, option 456, 465 
-i, option 463 
-1, option 465 
-m, option 466 
-n, option 466 
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-P, option 467 

-p, option 467 

-S, option 468 

-s, option 467 

-T, option 414, 469, 526 

-U, option 469 

-u, option 469 

-V, option 469 

-v, option 469 

-W, option 470 

-w, option 17,470,871 

affichage des warnings 17 
-X, option 471 
-x, option 456,470 
defaut, prendre des options par 472 
un seul caractere, traitement avec 

regroupement 821 
voir noms d'options individuelles; 

interpreteur, Perl 
options, modules Perl pour le traitement 
des 821 

or, operateur 89, 90, 95, 170, 572 

| (sur les bits) 88 

precedence, comparee a 1 1 289 

utilisation avec les operateurs de liste 113 

voir aussi barre verticale dans les symboles 
ord, fonction 657, 716 

portability de 593 

seechr 657 

Unicode et 379 
ordre 

voir precedence 
ordre des octets pour les 589 
orgueil 968 

origine des temps ($ A T) 625 
OS/2, systeme d'exploitation 

File::Spec::OS2, module 821 

invoquer des applications Perl avec 458 
$OS_ERROR 635 
%OS_ERROR, hachage 635 
$OSNAME 635 

ou exclusif (xor), operateur 88, 95 
ou, operateur 23 

precedence, ou vs. || 23 
our, declaration 48, 97, 115, 116, 716 

myou 704 

pragmas subs et vars ou 792 

raison de son existence 122 

strict, pragma et 813 

variables globales, portee lexicale 118 

vars, pragma et 814 
out-of-memory, erreurs 634 
$OUTPUT_AUTOFLUSH 636 
$OUTPUT_FIELD_SEPARATOR 636 
$OUTPUT_RECORD_SEPARATOR 636 



ouvrir 

des fichiers via des appels systeme de bas 
niveau 765 

sockets 746 
%OVERLOAD, hachage 636 
overload, pragma 320, 807 



-p (affichage pendant une boucle implicite), 

option de la ligne de commande 467 
p (correspond a la propriete) 378 
P (ne correspond pas a la propriete) 378 
-P (preprocesseur C), option de la ligne de 

commande 467 
-p (tube nomme), test de fichier 85, 404 
pack, fonction 589, 718-722 

caracteres des canevas pour 718 

exemple d'utilisation 58, 703, 742, 764 

longeur de chaine et 379 

ordre de octets et 589 

UTF-8et 379 

vecet 782 

voir unpack 
package, declaration 267, 722 
packages 968 
pads 46 

page d'accueil de Perl xxiv 
pages de manuel 

doc, sous-repertoire de CPAN 
contenant 515 
paires cle/valeur 

voir hachage 
PalmPilot 

modules Perl pour 517 
paquetage courant 968 
paquetage de plus haut niveau 49 
paquetage par defaut 114 
paquetage principal 49 
paquetage, declaration de 114 
paquetages 12, 46, 48, 265-274 

ajout de methodes a un paquetage 
existant 299 

attacher des variables aux 770 

citation 290 

consacrer des objets (avec bless) en 651 
dans le tableau @ISA, heritage par 296 
delimiteurs de 268 
eclater pour autocharger 827 
identificateurs 267 

importer des semantiques dans les 778 
methodes et sous-programmes, resolution 

de 286 
noms de 56, 572 
paquetage courant 968 
parametres de la fonction bless 291 
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relier des variables aux 778 

tables de symboles 269-273 
afficher 490 

voir aussi modules ; espaces de noms 
paquets 409, 968 
paragraphe, mode 461, 632 
parallele, traitement 

modele de thread 419-433 
parametres 

sous-programmes 

changer sur place 200 
travailler avec 200 

voir arguments 
parent, processus 

voir processus 
parentheses () 

voir parentheses dans symboles 
paresse 968 
partagee 

memoire, IPC System V 406 
partages, verrous de fichier 391 
pas a pas, parcourir du code 479 
passage de reference 199, 203, 947 

prototypes declarant les appels de fonctions 
comme 223 
passage par valeur 948 

copie des valeurs de @_ dans une liste 
my 200 

PATH, variable d'environnement 468, 471 

securite et 533 
PAUSE 522 

PDL (Perl Data Language) 517 
performances xvi 
mesurer 772 

Perl, efficacite dans les programmes 561- 
569 

peripherique nul, Unix 365 
peripherique, et stat 758 
Perl 

bibliotheque, installer des modules de 

CPANdans 521 
black 613 

C, utiliser depuis 501-507 

creer des extensions 503-505 
etendre avec XSUB 506 
fonctions d'une bibliotheque C externe, 
utiliser 506 
caracteres speciaux dans 5 
emplacement sur votre systeme 460 
extensions et mecanismes internes, modules 

pour les 825 
histoire de 611 
insererdansC 507-512 

compiler des programmes inseres 508 
Perl, ajouter un interpreteur a un 
programme C 508 



inserer en C 

instruction Perl, evaluer depuis C 510 
pile de Perl, manipuler depuis C 511 
sous-programme Perl, appeler depuis 
C 509 

machine virtuelle 443, 445 
modules pour s'interfacer ou emuler 

d'autres langages 518 
programmer, techniques courantes 553- 

586 

programmes, cycles de vie 436 

thread, programmer en 420 

utilisation d'Unicode, precautions sur 380 

versions de 635, 637 
Perl Data Language (PDL), module 249 
Perl Package Manager (PPM) 520 
Perl, interpreteur 436 

options 

voir options, ligne de commande 

-s, option 475 

sticky bit 566 
Perl/Tk 568 

modules Perl pour 518 
PERL_DEBUG_MSTATS, variable 

d'environnement 472 
PERL_DESTRUCT_LEVEL, variable 

d'environnement 304, 472 
$PERL_VERSION 637 
PERL5DB, variable d'environnement 472 

debogueur, personnaliser avec 488 
PERL5LIB, variable d'environnement 472 
PERL50PT, variable d'environnement 472 
PERL5SHELL, variable d'environnement 472 
perlapi, documentation 510 
perlcall, documentation 511 
perlcc, commande 447, 626 

pby, script resultant de 447 
$PERLDB 637 

PERLDB_OPTS, variable d'environnement 
AutoTrace, option, tracer les instructions de 

la phase de compilation 478 
personnalisation du debogueur via 487 
perldoc, commande xix, 275 
perlembed, documentation 507, 511 
perlfork, documentation 384 
perllocale, documentation 697 
perlmodinstall, documentation 520 
perlport, documentation 384 

informations sur la portability de 
fonction 648 
perlwin32, documentation 384 
permissions 766, 774 

interpretation des operateurs de permission 

de fichier 86 
utilisateurs, accorder des permissions 
limitees 526 
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permissions, et stat 758 
persistant, interpreteur Perl 507 
personnalisation, debogueur 487-490, 494 

fichiers d'initialisation, en utilisant des 487 

implementaion de l'editeur pour la 487 

options 488-490 
petit-boutiste 589,969 

exemple de 722 

packet 719 
phase de compilation 969 
pi 649, 797 

PID (processus ID) 638 

obtenir le groupe du processus depuis 685 

voir processus 
pieds de page 218 
piege de deliement 366-368 
piles 9, 245 

disciplines 715 

evaluation d'une expression 44 

machine virtuelle Perl 444 

Perl, manipuler depuis C 511 

sous-programmes, appels courants dans 652 

trace arriere avec la commande T 477 
pilotes materiels 

modules Perl pour interagir avec les 517 
pipe (|) 

voir barre verticale dans les symboles 
pipe, fonction 724 

portabilite de 588, 592 

socketpair ou 403, 747 

Win32 et 404 
pipelines 

sur plusieurs niveaux, pour les entrees 399 
sur plusieurs niveaux, pour les sorties 398 
pipes 

bidirectionnelle, communication 

interprocessus 402-404 
dans les communications 

interprocessus 397-405 

pipes nommes 404 

processus soliloquant 399 
fermer 658 

handles de fichiers en lecture seule, 

ouverture 711 
IO::Pipes, module 822 
open, fonction, risques de securite poses 
par 533 
places memoires 
lvalues for 964 
pour les octets 

voir grand-boutiste ; petit-boutiste 
plain old documentation 

voir pod 
pluralites 8 
.pm, fichiers 266 

chargement de fichiers associes 277 



pod 595-610 

directives 598,955 

Insertion dans Perl 43 

modules 603 

modules Perl pour 517 

traducteurs de 595, 603 
Pod::Checker, module 827 
Pod::Functions, module 827 
Pod::Html, module 827 
Pod::InputObjects, module 827 
Pod::Man, module 827 
Pod::Parser, module 827 
Pod::Select, module 827 
Pod::Text, module 827 
Pod::Text::Termcap, module 827 
Pod::Usage, module 827 
POE (Perl Object Environment) 517 
poesie en Perl 613 
point 

voir point dans les symboles 
point decimal, aligner 214 
pointeurs 44 

enC 221 

references, impossible de convertir vers 50 
vers des chames 720 
points d'arret 969 
lister tous 481 
positionner 475, 478, 480 
supprimer 480 

surveillance, expression et 481 
points de suspension (...) 141 
politiques d'ordonnancement et de preemption, 

threads 420 
poll, fonction 822 
pollution de l'espace de noms 278 
polymorphisme 284, 969 
ponctuation, detection des limites de mots 

et 162 

ponctuation, variables avec, gerer avec le 

module English 826 
pop, fonction 245, 724, 744 

exemple d'utilisation 64, 204, 695 

splice et 751 

split et 752 

tableaux lies et 348 

voir shift 
popen, fonction (C, langage) 507 
portabilite 

des fichiers et des systemes de fichiers 590 

des programmes Perl 587-594 

des signaux 591 

fonctions, informations sur 648 
gethostentet 684 
informations sur la 384 
tester l'efficacite de la 568 
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portages 

de Perl vers des systemes d'exploitation 516 
portees 5,46,969 
bloc 99, 116 
dans les boucles for 102 
dans les boucles foreach 104 
dans les boucles while 101 
dans les instructions if 100 
dans les threads 432 
de la gestion des signaux 386 
declarations 114 

voir aussi local ; my ; our 
declarations de paquetage 267 
dynamiques 119, 970 
fichier 116 
fonctions pour 646 
lexicales 48, 116 

operations de recherche de motif 130 

pile de portee 444 

pragma strict et 13 

sous-programmes 201 

variables my et our 267 

variables privees 

voir lexicales, variables 
portees dynamiques 114, 116, 970 

local, utilise sur les variables globales 119 

variables de motifs 130, 135 
portees lexicales 46, 48, 116, 970 

analyseur lexical ou 439 

declaration de 114 
voir aussi my 

espace prive et 312 

espaces de noms et 787 

fermetures et 238 

fichiers et 49 

our, declarations et 716 

pragma et 121 

variables attachees aux 48 

variables de paquetage, recherche de 49 

variables et 202 

voir aussi scopes 
ports 969 

nom/numeros, conversions pour 688 
ports serie 

modules Perl pour les 517 
pos, fonction 162, 725 

+ et 633 

\G et 163 

longeur de chaine et 379 
position de depart d'une correspondance 633 
position, assertions de 163 

changement avec l'ordre de la 
recherche 169 
positions 161-164 

detection des debuts de chaines 161 



detection des fins de chaines 161 
detection des frontieres de mots 162 
longeur de chaine et 379 
manipulation avec la fonction substr 161 
precedence dans la recherche 178 
specification de position apres la recherche 
precedente 163 
POSIX, classes 148 

POSIX, classes de caracteres de type 157-158 
POSIX, module 823 

avoir acces aux fonctions et variables 
exportees par 277 

bloquer des signaux avec 389 

strftime, fonction 701 
Posix, module 

getattr, fonction 681 
postcurseur 970 

postincrement et postdecrement, operateurs 75 

$POSTMATCH 637 

PostScript 

modules Perl pour 518 
pourcent (%) 

voir pourcent dans les symboles 
PPM (Perl Package Manager) 520 
pragmas 13, 113, 120, 266, 466, 778, 791-818 

a portee lexicale 121 

caracteres nommes 52 

modules et 276 

noms, casse dans les 47 
pre-etendre des tableaux 565 
precedence 77, 643, 970 

and contre &&, ou contre || 90 

defined 75 

diagnostic, messages de 871 
documentation en ligne xx 
expressions rationnelles 178-183 
modificateurs contre virgules 115 
modifications entre les versions de Perl 559 
my et 115 

operateurs logiques 23, 95, 289 
operateurs unaires, plus haute que celles des 

operateurs binaires 83 
sous-programmes lvalue et 212 
precurseur 970 

predeclarer des sous-programmes 302, 826 
predefini 970 
prefixe, operateurs 75 

metacaracteres fonctionnant comme 141 
$PREMATCH 637 
prendre le controle 

autour des boucles implicites 467 
preprocesseur (langage C) 970 
preprocesseur Perl 970 
pretraitement de Perl 584 
prets, descripteurs de fichiers 740 
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prevision 183 

print, fonction 19, 37, 565, 725 
efficacite de 561, 565 
erreur de virgule avec 554 
exemple d'utilisation 773 
handles de fichier lies et 357 
notation d'objet indirect de 288 
objets et 323 
parentheses et 84 
read ou 729 
select et 739 

separer les champs avec $, 636 
supplanter, lever une exception lorsque 842 
terminer des enregistrements avec $\ 636 
vidage avec $| 636 
voir printf 
write ou 216, 785 
printf 754 

printf, fonction 92, 726, 754 
$#et 623 
efficacite de 561 

exemple d'utilisation 659, 683, 759 
handles de fichier lies et 359 
style et 582 

supplanter, lever une exception lorsque 842 

voir print 

voir sprintf 
PrintRet, option du debogueur 489 
priorite, processus 686, 743 
prise de controle 

d'objets lors de leur destruction 303 
prive, espace 284 

modules Perl et 278-281 
privees, methodes, ignorer l'heritage avec 302 
privees, variables 

voir local 

prives, objets, utiliser des fermetures 312-314 
procedural, style de programmation 186 
procedures 14 
$PROCESS_ID 638 
processeur 

voir CPU 
processus 

attendredes 782 

communication interprocessus 383-416 

entre processus sur la meme 
machine 384 

fichiers 390-397 

IPC System V 405-409 

sockets 409-416 

sur Plnternet 383 
de processus 386 

envoyer des signaux a des groupes de 

processus 386 
fonctions pour 647 



fork, fonction 678 
identifiants (PID) 714 
multitaches, acces a la CPU dans des 

environnements 537 
obtenir le groupe pour des 743 
priorite, modifier 743 
priorite, renvoyer 686 
STDIN, STDOUT, et STDERR dans 18 
threads et 418 
tuer 696 

umask pour les 774 

variables pour 627 

verifier l'existence de 387 

zombies 387 
processus fils 

ID, renvoyer 678 
processus ID (PID) 

obtenir le groupe du processus depuis 685, 
743 

renvoye avec fork 678 

renvoyer 686 

waitpid, fonction 782 
processus zombie 980 
profiler avec DevehDProf 825 
profileur, Perl 494-498 
$PROGRAM_NAME 638 
programmation orientee objet 266, 283-318 

abstraction et 285 

modules Perl pour 517 

modules pour 275 

operations portables sur les fichiers 821 
references en Perl, emuler 267 
programmer, en Peri 553-586 
avec aisance 573-582 
ecrire des programmes portables 
manipulant des fichiers 590 
efficacite 561-569 

erreurs courantes des debutants 553-560 
generateurs de programmes 

autres langages en Perl 583 

filtres de code source 585 

generer du Perl dans d'autres 
langages 584 
generation de programmes 582-586 
portabilite 587-594 
style 186, 569-573 
programmes 

controler le debogueur depuis 478 

core dumps (copies du cceur du programme) 

dans 667 
executer 768 
execution 958 
finir avec exit 674 

moyenne des notes d'eleves, calculer et 
imprimer 15 
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nom de l'executable Perl 628 
nom du script perl 638 
one-liner 967 

parcourir pas a pas avec le debogueur 479 

sortie de 3 
progressive, detection 163 
projets (grands), avantages du pragma strict 

dans 13 
proprietaire, fichier 656 
proprietes 

casse, Unicode 379 

en programmation orientee objet 293 

Unicode 148,379 
proprietes de bloc, Unicode 154 
proprietes Unicode standard 151 
protection de ligne 

voir documents « ici-meme » 
protections, et stat 758 
prototype, fonction, lever une exception 

lorsqu'on la supplante 842 
prototypes 205-210,971 

& (esperluette), omission des noms de sous- 
programmes 205 

fermetures 240 

fonctions internes, emuler 205 

mise en ligne des fonctions constantes 208 

passage de reference implicite dans 223 

utilisation prudente de 209 
pseudo-commandes, recevoir/envoyer via un 

pipe 400 
pseudo-hachages 233 

implementer des classes avec 705 
heritage et 308 

pragma use fields, utiliser avec 307 

simuler avec la fonction overload 328 
pseudo-litteraux 

voir operateurs d'entree 
pseudo-operateurs, surcharge et 323 
pumpkins et pumpkings 971 
push, fonction 44, 245, 727, 744 

emuler 205 

exemple d'utilisation 204, 247 
fonction pop 45 
hachage et 9 

references de tableaux et 230 

splice et 751 

tableaux lies et 348 

voir unshift 
push-pop (PP), codes 443 
PV (valeur de chaine interne) 500 
pwd, commande (Unix) 566 
Python 42 

differences avec Perl 554 



Q 

q// (citation), operateur 331 

qr// (quote regex), operateur 128, 174 

modificateurs pour 130 
qr// (regex protegee), operateur 61 
Qt 

modules Perl pour 518 
quantificateurs 32, 33, 126, 142-143, 158-161, 
563 

atomes et 180 
classes de caracteres et 149 
gourmand 160 
minimal et maximal 143, 159 
utilisation du metacaractere point (.) 
avec 147 

quarantaine, mettre le code suspect en 544 
queues 

voir files d'attente 
quitter 

debogueur Perl 485 

des boucles infinies 103 
quotation 

voir isolement 
quotemeta, fonction 728 

exemple d'utilisation 193 
qw (mots proteges), operateur 55, 63 
qx// (execution protegee), operateur 54, 61, 69, 

731 

open, pragma et 807 
portabilite de 588 

voir aussi backtick devant les symboles ; 
fonction systeme 

R 

-r (accessible en lecture par son uid/gid), test 25 
-R (lisible par l'uid/gid reel), test de fichier 85 
-r (lisible par l'uid/gid reel), test de fichier 85 
raccourcir les tableaux 65 
race conditions (situations de concurrence) 

test de fichiers et 803 
ramasse-miettes 244 

avec les methodes DESTROY 304 

des globales 971 

objets associes a des variables liees 341 
rand, fonction 78, 728 

exemple d'utilisation 78, 111, 327, 549 

voir srand 
random, fonction 

exemple d'utilisation 660 
rapport de bogues Perl xxv 
rapports, generation 213 
rationnelles 

voir expressions regulieres 
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RE 

voir motifs 
re, pragma 808, 826 
read, fonction 729 

handles de fichier lies et 359 

print ou 729 

signaux et 388 

voir sysread 
readdir, fonction 729 

voir opendir 
readline, fonction 69, 730 
ReadLine, module 

voir Term::ReadLine, module 
readlink, fonction 731 

portabilite de 588 
readpipe, fonction 731 

portabilite de 588 
$REAL_GROUP_ID 638 
$REAL_USER_ID 638 
recallCommand, option du debogueur 488 
recherche 

chemin pour les recherches de 
bibliotheque 630 

de sous-chaines 135 

des scripts 468 

des sous-chaines 693 

expressions regulieres dans les 30 

grep, fonction pour 692 

lineaire, ou hachages 561 

regies pour la recherche de mots 49 
recherche de texte 

modules Perl pour la 518 
recherche globale 

voir/% modifier 
rechercher-remplacer, global 136 
recompilation de motif, limiter avec le 

modificateur /o 131 
recursion 

des piles de memoires de travail 
lexicales 445 
recursivite 

dans les recherches de motifs 193 

des sous-programmes 201 
recv, fonction 731 

exemple d'utilisation 415 

portabilite de 588 

sockets et 742 

voir send 
redo, operateur 106, 107 
redondance dans Perl 24 
reduction canonique 951 
ref, fonction 291, 732 

attributes, pragma et 793 

defined 236 

exemple d'utilisation 293, 310, 321, 325, 340 



referencement et dereferencement 

implicite 223 
references 7,221-244 

a des donnees anonymes 224-226 

a des entrees de table de symboles 228, 272 

a des fonctions 

stockage dans des structures de 
donnees 259 
a des gestionnaires de signaux (definis par 

l'utilisateur) 384 
a des hachages 251 

hachages multidimensionnels 259 
a des handles de fichiers 227 
a des objets 226, 233, 285, 291 

invoquants pour methodes 
d' instance 285 

surcharge et 319 
a des sous-programmes 198 
a des sous-programmes, recuperer de ou 

passer a 271 
a des structures de donnees 223 
a des tableaux lies 345 
a des variables objet liees, annuler 367 
a des variables scalaires liees 339 
accolades et crochets avec 242 
affaiblir et annuler 304 
circulaire 

memoire utilisee par 244 

surcharge, eviter avec la 328 
consacrer 291 

conversion en chaines 236, 243, 248, 249 
creation 223-229 

avec l'operateur antislash 223 
dans des tableaux multidimensionnels 246 
dans les tables de symboles, vers d'autres 

tables de symboles 269 
definition 221-223 
destruction (globale), controler 472 
dures 972 
en dur 79 
faibles 244 

hachage, clefs de, fournies en tant que 826 

indirection et 49, 221 

passage par 199, 203 

Perl, pointeurs C contre 96 

programmation orientee objet et 267 

symbolique 241 

typage vers d'autre types de pointeurs 50 
valeur booleenne des 26 
verifier les 732 
verrouiller 426 

vers des handles de fichiers 708 
references arrieres 36, 133, 554, 623, 972 
acces avec les variables numerotees 165 
creation avec des parentheses 166 
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motifs generes en fonction de leurs propres 
references arrieres 193 

voir aussi capture ; motifs 
references circulaires 244 

annulation de boucles 304 

surcharge, eviter avec la 328 
references en dur 79, 221, 223, 972 

96SIG, hachage 384 

utilisation 229-241 
fermetures 237-241 
references faibles 244 
references symboliques 221, 241, 972 
referents 222 

objets en tant que 285 
reftype, fonction (pragma attributes) 291 
regexps 

voir motifs 
registre, base de (Microsoft Windows) 

.pi, extensions et 458 

manipuler 830 
registre, base de (Microsoft Wiondows) 

manipuler 519 
regroupement dans des motifs 167 

sans capture, raisons pour 167 
regroupement, operateur de 126, 142, 181 

emboitement 165 

pour les expressions 77 
regulieres, expressions 

voir motifs 
relation, operateurs de 87 

non-associativite de 88 
relier 

des variables aux paquetages 770, 778 
remplacement d'occurrences 

voir sill (substitution) operator 
remplacement, chaines de, construction avec le 

modificateur /e 189 
remplacer des elements de tableaux 751 
rename, fonction 733 

exemple d'utilisation 464, 670 

portability de 591 
rendu bidirectionnel, proprietes Unicode 153 
reperes, pile de 445 
repertoire de base 972 
repertoires 

ajouter au debut de @INC 465 

changer le repertoire de travail 653 

creer 702 

creer ou supprimer de maniere portable 821 
de travail courants, obtenir le chemin 

des 821 
DirHandle, module 822 
fermer 659 
fonctions pour 646 
handles 961 
IO::Dir, module 822 



lire des entrees depuis les 729 
modules Perl pour les 518 
opendir, fonction 716 
operateur de test de fichier 25 
redefinir la racine 657 
rewinddir, fonction 736 
seekdir, fonction 739 
supprimer 736, 776 

tests de fichiers dans des arborescences 821 
repetition (x), operateur 20, 82 
require, fonction 113, 276, 630, 733 

@INCet 789 

DATA et 59 

base, pragma et 794 

caller et 653 

chargement de fonction et 203 
declaration de paquetage et 267, 723 
do ou 666 
lib, pragma et 804 
porteeset 117 
tieet 337 
useou 778 
voir use 
reseau 

adresses reseau 

convertir en noms 684 
adresses, convertir en noms 682 
clients en 411 

informations reseau, fonctions pour la 

recherche 647 
modules pour la communication 410, 517, 

823 

serveurs en 412-414 
services 

modules Perl pour interagir avec les 519 
systeme de fichier en reseau 

voir NFS 
Win32, module reseaux 830 
reseaux 

connexion (entre client et serveur) 953 
reset, fonction 734 
retour arriere 52, 178 

dans les recherches de motifs 178 

sous-motifs sans retour arriere 185 
retour chariot 52 

dans une classe de caractere POSIX 157 

voir sauts de ligne 
retours, pile de 445 
retrovision 183 
return, fonction 106, 199, 735 

erreurs et 201 

evalet 108,669 

thread, terminaison avec 422 
reutilisees, afficher le contenu des adresses 490 
reutiliser du code 573 

reval, methode, lancer du code suspect avec 545 
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reverse, fonction 37, 735 

exemple d'utilisation 37, 103, 325 

prohibee avec sort 560 

scalar et 379 
revisions 

voir versions 
rewinddir, fonction 736 

voir opendir 
rindex, fonction 736 

longeur de chame et 379 
rmdir, fonction 736 

root directory (repertoire racine), redefinir 657 

rotl3, cryptage 139 

routines 

voir sous-programmes 
RS (variable awk) 

voir $INPUT_RECORD_SEPARATOR 
RSTART (variable awk) 

voir signe arobase, @- dans les symboles 
RTF 

modules Perl pour 518 
RV (valeur de reference interne) 500 
rvalues 44 

s 

-s (analyse d'options), option de la ligne de 

commande 467,475 
-S (recherche de scripts), option de la ligne de 

commande 468 
-S (socket), operateur de test de fichier 85 
-s (taille non nulle), test de fichier 85 
/s, modificateur de motif 130, 134, 136, 142 
s/// (substitution), operateur 61, 124, 135-138, 

554, 975 

=~ et !~, operateurs de liaison 128 

fournissant une interpolation de guillemets 
doubles 127 

modificateurs pour 130, 136 
Safe, module 544,825 

code non sur, gerer du 544 
saturation des serveurs, problemes (motifs et 

expressions regulieres), soucis de 

securite 550 
saut de ligne 3, 588 

correspondance avec le metacaractere point 
(.) 147 

correspondances sur des chames en 

contenant 131 
dans les chaines litterales 53 
dans les noms de fichiers, risques de securite 

des 534 
portability des 588 
suppression des 19 

supprimer avec la fonction chomp 655 
saut de page 629 



sauvegarde de structures de donnees 262 
sauvegardes, fichiers 465 
sauvegardes, pile de 444 
scalaire, contexte 

fonctions dans un 645 

forcer 737 

operations se comportant differemment 

dans un 555 
reconnaitre dans le debogueur 477 
virgule, separateur en 560 
scalaires 5, 6, 44 

application d'operateurs de detection de 

motif a 128 
caracteres, longueur de 698 
constant 

voir aussi constantes 
conversion des listes en 11 
ensemble non ordonne de 

voir hachage 
fonctions pour manipuler 646 
lier 337-344 

definitions d'une classe de base, fournir 
des 826 

empecher Futilisation non localisee de 

variables $_ 342 
methodes pour 338-342 
variables compteur magiques 342 

liste de 

voir tableaux 

parametres et liste de retour, sous- 
programmes 199 

Perl, convertir en types C 510 

references 7 

references en dur comme 222 
structures de donnees complexes 

representees avec des 12 
SV (valeur scalaire) 500 
valeurs 50-59 

chaines litterales 51-54 

documents « ici-meme » 56 

interpolation des valeurs de tableau 56 

litteraux numeriques 51 

operateurs pour 77 

v-chaine litterales 58 
variables 

en contexte de guillemets doubles 135 
noms de 45 
verite, evaluation avec les 26 
scalaires sans qualifiants 50 
scalar, fonction 60, 737 

exemple d'utilisation 236 
prototypes et 205 
reverse et 379 

tableaux et hachages, determiner la 
taille 698 
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scalars 973 
scripts 

associer avec l'interpreteur 16 
CGI, mode de marquage et 527 
construire avec l'option -e 463 
de langage naturel, verifier 154 
deboguer 461 

voir deboguer 
duree d'execution de 87 
erreurs courantes pour les debutants 553- 

560 
executer 768 

generer des core dump 469 
idiomatique, en utilisant du Perl 573-582 
inclure dans des messages 470 
interpretation, en shell ou en Perl 558 
marqueur de fin de 59 
noms des 

voir dollar, $0 dans les symboles 
non stirs 543 

passer implicitement via l'entree 
standard 456 

pause dans les 746 

performance des 561-569 

rechercher des 468 

rechercher et compiler 456 

repertoire CPAN des 516 

style 569-573 

terminer avec exec 671 

test, scripts de 829 

verifier la syntaxe des 461 
SDBM_File, module 825 
Search::Dict, module 820 
securite xvi, 525, 757 

cracker 954 

gerer des donnees non sures 526,533 
acces aux commandes et aux fichiers 
avec des privileges restreints 534 
detecter et blanchir des donnees 
marquees 529 

gerer du code non stir 543 

compartiments de securite pour 544 
deguiser du code en donnees 548 

gerer les problemes de synchronisation 536 
bogues de securite du noyau Unix 537 
fichiers temporaires 541 
situations de concurrence 538 

modules Perl pour la 518 

modules pour la 825 

operateurs de test de fichier et 803 

Win32::FileSecurity, module 830 
sed 30, 138 
seek, fonction 738 

-x option et 470 

DOS, mode texte et 588 



exemple d'utilisation 393 

Fcntl, module et 842 

File::Tempet 543 

handles de fichier lies et 358 

voir tell, fonction 
seekdir, fonction 739 

telldiret 770 

voir opendir 

voir telldir 
select (descripteurs de fichiers prets), 

fonction 676, 739, 740, 822 

dormir un peu avec 405 

exemple d'utilisation 415 

filenoet 676 

IPC::Open3et 856 

s'endormir rapidement avec 741, 746 
select (handle de fichier de sortie), fonction 726, 
739 

exemple d'utilisation 216, 412, 465, 713, 784 

FileHandle, module de substitution 
pour 851 

IPC::Open3 et 402 

portabilite de 588 

pour les variables de format 216 

variables et 620 
select, appel systeme, multiplexer les 

entrees/sorties entre les clients 413 
selecteur, ligne de commande 

selecteur-e 16 
SelectSaver, module 822 
self, methode (Thread, module) 424 
SelfLoader, module 274, 828 

Devel::SelfStubber, module, utiliser 
avec 828 

semantique d'octets, raccourcis pour les classes 

de caracteres en 149 
semantiques, importer dans des paquetages 778 
semaphores 973 

fonctions pour les 741 

IPC::Semaphore, module 824 

memoire partagee 406 

thread, securite et 420 

Thread::Semaphore, module 432 

utilisation dans le verrouillage de 
fichier 393 

Win32::Semaphore, module 830 
semctl, fonction 741 

portabilite de 588 
semget, fonction 742 

portabilite de 588 
semop, fonction 742 

portabilite de 588 
send, fonction 742 

portabilite de 588 

voir recv 
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separateur de champ different, specifier un 952 
separateurs, definition avec l'operateur split 31 
sequence d'echappement pour les caracteres de 

controle 51 
sequence de tri 973 

sequences de caracteres combines, correspondre 
avec\X 378 

sequences de touches, generer des signaux avec 
des 384 

sequences de traduction a l'interieur de 

guillemets doubles 173 
serialiser des structures de donnees Perl 825 
server-push, scripts CGI 824 
serveurs 412-414 

clonage avec fork pour s'occuper des 
connexions entrantes 413 

marquage, importance d'activer le mode 
de 527 

modules Perl pour les 519 

TCP 411 

service, port, conversions nom/numero 688 
set-id, programmes 526 

bogues du noyau Unix 

problemes de securite avec les 537 

dangereuses, gerer des operations 534 
setgid 526 

voir set-id, programmes 
setgrent, fonction 681 

portabilite de 588 
sethostent, fonction 684 

portabilite de 588 
setnetent, fonction 647, 685 

portabilite de 588 
setpgrp, fonction 386, 743 

portabilite de 588 
setpriority, fonction 743 

portabilite de 588 
setprotoent, fonction 687 

portabilite de 588 
setpwent, fonction 687 

portabilite de 588 
setservent, fonction 689 

portabilite de 588 
setsockopt, fonction 743 

exemple d'utilisation 412, 415 

portabilite de 588 
setuid 526 

voir set-id, programmes 
sh (Bourne shell) 974 

#! (shebang), notation et 457 

eval exec, bidouille et 17, 468 

exec et 671 

pipe, recevoir/envoyer via un 398 
piper avec 711 
system, fonction et 527 



User::pwent et 869 

valeurs de sortie depuis 768 

voir shells 
shadow, entrees de mots de passe 687 
Shell, module 823 
shells 974 

apostrophe, passer via 463 

Bourne shell (sh) 457 

commandes dans les 952 

commandes du debogueur et 484 

commandes pipees avec des metacaracteres, 
passer au 711 

court-circuiter avec -| 400 

engendrer, caracteres pour 488 

environnement, variables 471 

positionner temporairement 471 

eviter avec des open sur des pipes avec 
plusieurs arguments 398 

eviter l'utilisation de 535 

flux I/O, parametrer un 18 

Perlou 557 

pieges de securite en utilisant, eviter 549 

pipe, commandes avec des caracteres 
speciaux, manipuler 398 

possibility pour Perl, systemes Windows 472 

variables d'environnement 806 
trous de securites 533 
shift, fonction 28, 83, 245, 744 

_et 575 

efficacite de 561 

exemple d'utilisation 704 

files et 727 

splice et 751 

voir pop 

voir unshift 
shmctl, fonction 744 

portabilite de 588 
ShMem, paquetage 407 
shmget, fonction 745 

exemple d'utilisation 407 

portabilite de 588 
shmread, fonction 745 

exemple d'utilisation 408 

portabilite de 588 
shmwrite, fonction 745 

exemple d'utilisation 408 

portabilite de 588 
shorts 756 

shutdown, appel systeme 412 
shutdown, fonction 412, 745 

exemple d'utilisation 747 

portabilite de 588 
96SIG, hachage 384, 639 
sigaction, appel systeme 388 
SIGALRM, signal 649 
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signalLevel, option du debogueur 488 
signatures de messages 

modules Perl pour les 518 
signaux 383, 384-390 

96SIG, hachage 384,639 

en Perl ou en langage C 557 

bloquer 389 

envoyer a des groupes de processus 386 
intercepter avec le pragma sigtrap 385, 823 
minuter les operations lentes 389 
portabilite des 591 

provoquer dans la bibliotheque C 385 

sources des 384 

Thread::Signal, module 433 

threads, delivrer aux 420 

tuer des processus avec 696 

zombies, processus et 387 
sigprocmask, appel systeme 389 
sigtrap, pragma 385, 809 
simple apostrophe (') 

inhiber ['interpolation des variables 6 
sin (sinus), fonction 746 

complexes, nombres et 857 

exemple d'utilisation 443, 650 
singularity's 

voir scalaires 
situations de concurrence (race conditions) 

gerer 538 

noyaux Unix et 537 

operations lentes et 389 

test de fichiers et 803 

verrouillage de fichier et 340, 391 
sleep, fonction 746 

alarm et 649 

exemple d'utilisation 103 

resolution en dessous de la seconde 741 

select, fonction au lieu de 741 
slurping files 974 
socket, fonction 

accept et 648 

autovivification avec 700 

portabilite de 588 
Socket, module 410, 824 

client en reseau, se connectant a un 
serveur 411 

inet_ntoa, fonction 683 
socketpair, fonction 403, 747 

portabilite de 588 
sockets 

accepter les connexions de clients 648 

arreter une connexion 745 

attacher une adresse a 650 

bas niveau, fonctions pour l'acces 647 

connecter 659 

dans les communications 



interprocessus 409-416 

clients en reseau 411 

passage de message 415 

serveurs en reseau 412-414 
envoyer des messages sur des 742 
fermer 658, 745 
fonctions pour les 409, 689 
listen, fonction pour 698 
modifier les options 743 
modules pour les 823 
obtenir une adresse avec un empaquetage 

sockaddr 685 
ouvrir avec socket, fonction 746 
protocoles et 383 
recevoir des messages sur des 731 
sauts de ligne, envoyer via des 588 
TCP et 409 
Unix, domaine 409 
sommes de controle 777 
sort, fonction 11, 37, 747-751 
hachages et 255 

les operateurs de comparaison dans la 24 
locales et 806 
localisation de $a et $b 620 
longueur de chaine et 379 
optimisation de 442 
reverse et 560 
variables 624 
sortie 17 

accumulateur du format de sortie 680 

blocs a un seul passage 108 

blocs if ou unless 108 

canal de sortie courant 951 

de programmes 3 

debogueur, selectionner 491 

declarer un format d'enregistrement de 213 

des boucles infinies 103 

des pipes 397-405 

bidirectionnels 402 

filtrer 400 

STDOUT en tant que pipe vers un autre 

programme 398 
tridirectionnels 402 
selectionner les handles de fichiers pour 
la 739 

separateur d'enregistrements en 

voir dollar, $\ dans les symboles 
separateur de champs en 

voir dollar, $, dans les symboles 
STDOUT, handle de fichier 677 
tableau et hachage, changer le style 

(debogueur) 490 
verifier les descripteurs de fichiers pour 

la 740 



1034 



Index 



sortie standard 

voir STDOUT 
sorties 

fichiers, mode d'ouverture pour les 710 

fonctions pour 646 

utiliser ioctl pour les 694 

XSUB 506 
sorties (backends), compilateur 830 
sorties du compilateur 446 

modules 446 
sortir 

debogueur Perl 485, 489 
souches (stubs) pour les modules, generer 828 
Souligne, module 343 
source 

voir code source 
source, code 

etranger, executer du code 525 
sous-chaines 974 

remplacement avec l'operateur s/// 135 
sous-classes 284 

attributs, supplanter des ancetres de 
surclasse 306 
sous-espaces de nommage des variables 46 
sous-motif de code dans les expressions 

rationnelles 974 
sous-motifs sans retour arriere 185 
sous-programmes 6, 14, 197-212, 285 

annuler avec exit 674 

anonyme 197 

references a 226 

appel 

executer sans les parcourir pas a pas 479 
indirect 198 

invocation de methode comparee a 292 
arguments 625 

attributs, consulter et positionner 825 
autochargement 273-274, 301, 827 
B::Xref, module, references croisees avec du 
C 449 

chargement de definitions depuis d'autres 

fichiers 113 
classes de meme nom 290 
commandes du debogueur pour lister les 

correspondances de motifs 483 
constantes 271 
controles de boucle et 108 
declaration 112 

dans le paquetage avec 
AUTOLOAD 302 
declarer 761 
definition 199 

do SOUS-PROGRAMMES, operateur 667 
emboitements de 240 
execution 958 



externes 501 

portability des 592 
importation depuis un autre module 198 
indication d'erreurs 201 
lvalue 314 

methodes comparees a 286 

mots simples, confondre avec les 558 

nommes, interactions 

compilateur/interpreteur 451 
noms de 46, 47, 198 
passage de donnees en entree et en 

sortie 199 
passage de references a 203 
performance et 563 
Perl, appeler depuis C 509 
pile d'appels 652 
portee lexicale 704 
problemes de portee 201 
prototypage 205-210 

utilisation prudente de 209 
redefinition et mise en ligne 209 
references a 

dans les scalaires 7 

recuperer de ou passer a 271 
renvoyer des references 226 
resolution de methode, etapes de 295 
substitution par goto 112, 692 
travailler avec une liste de parametres 200 
valeurs de retour 199, 735 
verrouiller pour des threads 428 

locked, attribut 429 
voir aussi fonctions 
sous-programmes non definis, appel avec 

AUTOLOAD 273 
soustraction 

de jeux de caracteres 156 
modificateurs de motif avec les cloitres 168 
objets surcharges 321 
speciales, variables 622 
splice, fonction 751 
delete ou 664 
efficacite de 561 

exemple d'utilisation 327, 343, 725, 727 
modifications entre les versions de Perl 559 
tableaux lies et 348 
split, fonction 31, 128, 167, 752 

des champs de longueur variable, extraire 

avec 952 
efficacite de 562, 565 
exemple d'utilisation 15, 64, 98, 252, 254, 

574, 702 
join et 138 
patterns et 31 
reverse et 325 

supplanter, lever une exception lorsque 842 
voir aussi join 
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sprintf, fonction 359, 754-757 

anneee sur deux chiffres et 691 

arrondir avec 694 

exemple d'utilisation 136, 338, 707 

handles de fichier lies et 355, 359 

longueur de chaine et 379 

notation de vecteur pointe 683 

voir hex 

voir oct 

voir printf 
sqrt (racine carree), fonction 757 

complexes, nombres et 857 

exemple d'utilisation 746 
srand, fonction 757 
src, repertoire (CPAN) 516 
stat, fonction 758 

_ et 87, 623 

exemple d'utilisation 63 
File::statet 531 

handles de fichiers, appeler sur des 540 

permissions de fichiers et 707 

portabilite de 588 

scripts de super-utilisateur et 86 

supplanter 821 

voir File::stat, module 

voir lstat 
statique, edition de liens 502 
statique, portee 

voir portees lexicales 
statiques, variables (en C/C++) 202 
statistiques 

modules Perl pour les 517 
statut de retour d'un processus 625 
STDERR, handle de fichier 573, 621, 640, 677 

envoyer une sortie a un autre processus 369 

passer des handles de fichiers a de nouveaux 
programmes via 395 

reaffecter 414 
STDIN, handle de fichier 621, 640, 677 

-i, option de la ligne de commande et 465 

lire un seul caractere depuis 681 

passer des handles de fichiers a de nouveaux 
programmes via 395 

reaffecter 414 
STDOUT, handle de fichier 621, 640, 677 

-i, option de la ligne de commande et 465 

afficher dans 725 

passer des handles de fichiers a de nouveaux 

programmes via 395 
reaffecter 414 
sticky bit 566 

stockage de donnees complexes dans un fichier 

DBM 368 
stockage des donnees 

lvalues pour 21 



stopper 

voir terminer 
strict, pragma 13, 48, 121, 241, 812-814, 826 

mots simples et 556 
stringification (transformation en chaines) 

modules pour la 838 
struct 

emuler 309 
Struct::Class, module 306 
structure case 109 
structures 

formatter 721 
structures de controle 25-30 

verite, definition 26 
structures de donnees 245-263, 517, 975 

autoreferentielles, classes conteneur avec 
pointeurs sur 304 

complexes, representees par des scalaires 11 

conversion en chaines 262 

elaborees, enregistrements de 259-262 

hachages de fonctions 259 

hachages de tableaux 252-254 

hachages multidimensionnels 255-259 

objets 

voir objets 

organisation en Perl 251 

persistantes, avec tie 369 

plates, lineaires en Perl 221 

pour objets 291 

references a 223 

sauvegarde 262 

tableaux de hachages 254-255 
structures de donnees complexes 

creation en Perl 245 

representees avec des scalaires 12 
structures de donnees persistantes, fournies avec 

tie 369 

StrVal (dans le pragma overload) 332 

stubs (souches) pour les modules, generer 828 

study, fonction 759 

style, programmer avec 569-573 

sub, declaration 197, 206, 226, 761 

subs, pragma 302, 814, 826 

surcharger des fonctions internes avec 281 
$SUBSCRIPT_SEPARATOR 67, 640 

voir signe dollar, $; dans les symboles 
substitution 

en shell ou en Perl 558 

evaluation de 189 

operateur 
voir sill 
substr, fonction 762 

\Get 163 

chop et 656 

efficacite de 563, 566 
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exemple d'utilisation 325, 408, 607, 656 

longueur de chaine et 379 

manipulation des positions de chaine 161 

variables speciales contre 633 
sucre syntaxique 975 
SUPER, pseudo-classe 297, 298 
super-utilisateur 975 
superieur a (>), operateur 

voir gt 

voir superieur dans les symboles 
superieur ou egal a (>=), operateur 
voir ge 

voir superieur ou egal a dans les symboles 
supprimer 

caracteres 655 

des elements de tableaux 724, 744, 751 
fichiers 775 

les variables d'environnement 627 
points d'arret 480 
repertoires 736, 776 
toutes les actions du debogueur 483 
surcharge 77, 319-333, 975 
a Pexecution 333 
autogeneration de 324 
constantes 330 
constructeur de copie 328 
conversion en chaine 360 
de fonctions 281-282 
definition, appliquee aux fonctions 

predefinies 60 
diagnostics 333 
fonctions de 332 
fonctions mathematiques 326 
handlers 320 
heritage et 332 

methodes de classe de base 297 
nomethod et fallback 329 
operateurs surchargeables 322-328 
overload, pragma 320, 820 
Overloaded (methode dans le pragma 

overload) 332 
references circulaires, eviter 328 
triet 326 

surcharge des constantes chaine, transformer un 

texte grace 194 
surclasses 284 

surveillance, expressions 481 
SV (valeur scalaire interne) 500 
SWIG, systeme generant des XSUB 

automatiquement 502 
switch, instruction 109, 564, 973 

programmer en Perl ou en C 557 

Sx 

modules Perl pour 518 
symboles 42 

exporter 277, 280 



importer dans le paquetage courant 276 

metasymboles 

jokers generiques 147 

omettre de la liste d'export ou supprimer de 
la liste d'import 279 
symboles, tables de 

Symbol, module 820 
symlink, fonction 763 

portabilite de 588,590 
synchronisation 976 

problemes, gerer 536, 537 
fichiers temporaires 541 
situations de concurrence, gerer 538 
syntaxe 976 

en Perl 44 

verifier 461 
Sys::Hostname, module 823 
Sys::Syslog, module 823 
syscall, fonction 649, 763 

fileno et 676 

h2phet 790 

portabilite de 588 

setitimeret 746 

valeur de retour de 645 
syslog, liaison de handle de fichier a 369 
sysopen, fonction 393, 765 

ecrasement de fichiers et 539 

eviter les situations de concurrence avec 405 

exemple d'utilisation 534, 542, 859 

Fcntl, module et 842 

marquage et 534 

open et 714 

open, pragma et 807 

permissions de fichiers et 774 

portabilite de 588 

verrouillage de fichier et 392 

voir open, fonction 
sysread, fonction 767 

exemple d'utilisation 769, 861 

handles de fichier lies et 359 

read ou 729 

voir read 
sysseek, fonction 767 
System V, IPC 

voir IPC System V 
system, fonction 768 

$? et 453, 625, 665 

efficacite de 566 

exec ou 671 

exitet 679 

forme avec un argument de liste, eviter le 

shell avec la 549 
marquage et 528 
ou apostrophes inverses 571 
portabilite de 588 
set-id, programmes et 534 
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shells Windows et 472 

supplanter, lever une exception lorsque 842 

voir exec 

voir qx 

waitet 782 
$SYSTEM_FD_MAX 641 
systeme d'exploitation 

interpreteurs de commandes pour les 455 

invoquer les interpreteurs avec la ligne 
#! 456 
systeme, appels 

performance et 566 
systeme, fonction 

portabilite de 592 
systemes d'exploitation xiii, 976 

#!, simuler la technique sur les systemes non- 
Unix 458 

bibliotheques de traitement des threads 420 
fiabilite des signaux sur les 388 
flock, implementation sur les 391 
fork, implementation sur les 397 
interfaces graphiques, reposant sur des 591 
interpreteur Perl, demarrer 16 
manipuler les interfaces des 823 
modules Perl pour les 517 
noms de module, traduction en noms de 

repertoire 276 
noms des 635 

portabilite des programmes Perl 516, 587- 
594 

sauts de ligne, variations dans les 588 
signaux et comportements par defaut 
des 386 

sockets, implementation des 410 
systemes de fichiers 958, 976 

portabilite des 590 
syswrite, fonction 355, 769 

exemple d'utilisation 341 

gestionnaires de signaux et 639 

handles de fichier lies et 355, 359 

T 

-T (texte), test 25 

-T (texte), test de fichier 86 

-t (tty), test de fichier 85 

-T (verification du marquage), option de la ligne 

de commande 410, 469, 526 

serveurs et 414 

voir marquage, verification du 
\t, caractere de tabulation 125 
table de correspondance, pseudo-hachages 307 
table de symboles 

paquetage 723 
tableau @ARGV 70,948 

exemple d'utilisation 28 



tableaux 5, 8, 44, 45, 56, 976 
@_, tableaux 199 

copier des valeurs dans une liste my 200 
ajouter des elements aux 727 
analyser du texte dans des 820 
anonyme, references a 224 
anonymes, objets implemented comme 306 

pragma use fields, surmonter les 
problemes avec le 307 
associatifs 

voir hachages 
AV (valeur tableau), typedef en C 

correspondant a 500 
de hachages 254-255 

acces et affichage 255 

generation 254 
de tableaux 65 
dernier element des 65 
elements, donner des valeurs temporaires 

aux 699 
emboitements de 245-252 

tableaux a deux dimensions, creation et 
acces 246 
exists, fonction et 673 
hachages de 252-254 
indices negatifs, compter depuis la fin du 

tableau 560 
initialisation avec l'operateur x 83 
liaison 344-349 

commodite de notation 348 

methodesde 345-348 
lies, fonction delete et 560 
listes et 62-65 
longueurs de 65 
marques 527 

mettre des elements au debut de 777 
multidimensionnels 11, 245, 976 
noms de 45 
operateur s/// et 137 

passage par reference en entree ou sortie de 

fonction 203 
performance et 565 
pop, fonction et 724 
premier element d'un 623 
references a 223 

remplacer/enlever des elements de 751 
separateur de sous-tableau 

voir dollar, $; dans les symboles 
style de sortie, changer dans le 

debogueur 490 
supprimer des elements de 744, 751 
traitement, fonctions pour 646 
variables de 56 
voir aussi listes 
tableaux a deux dimensions, creation et 
acces 246 
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tableaux et hachages, reference a 8 
tableaux multidimensionnels 11, 976 
tables 

voir aussi tableaux multidimensionnels 
tables de symboles 46, 48, 269-273 

afficher pour les paquetages 490 

changements temporaires avec local 120 

contenant des references a d'autres tables de 
symboles 269 

dans les noms absolus 47 

identificateurs de noms de formats dans 680 

nommer les entrees de references 
symboliques dans 222 

paquetage courant, determiner l'utilisation 
de 267 

paquetages 268 

references a 228 

surnom des entrees de 68 
taches legeres 

voir threads 
taille 

des nombres 589 

representation d'un caractere 374 
taille de bloc, et stat 758 
taille, et stat 758 
taintperl, programme 560 
tampon 

bloc 976 

commandes 976 

exemple d'utilisation 411 
tampon, vidage 636 
tamponnage 

ligne 977 
tan (tangente), fonction 649 

Math::Triget 858 

voir atan2 
tar, fichiers 

modules Perl pour les 519 
TCP 977 

clients/serveurs 411 

IO::Socket::INET et 411, 412 

Socket, module et 411 

sockets et 409 

sur des sockets du domaine Internet 409 

UDP ou 415 

voir IO::Socket, module 

voir setsockopt 
tee, programme Unix 365 
tell, fonction 770 

DOS, mode texte et 588 

fgetpos comme alternative a 852 

handles de fichier lies et 358 
telldir, fonction 770 

seekdiret 770 

voir opendir 

voir seekdir 



temoins, placer sur des variables Perl 369 
temporaires, fichiers 850 

creer avec FileHandle 852 

dangers des 541 

File::Tempet 542 

POSIX, module et 859 

risques de securite avec les 541 
temps 

age d'un fichier 87 

dormir 746 
temps origine ($ A T) 625 
Tengwar, caracteres 378 
Term::Cap, module 825 
Term::Complete, module 825 
Term::ReadKey, module 487, 681 
Term::Readline, commande 825 
Term::ReadLine, module 487 

desactiver ['implementation dans le 
debogueur 491 
Term::Rendezvous, module 491 
termes 44, 977 

expression avec des operateurs de leurs 
relations 75 

precedence 77 
terminaison des boucles infinies 103 
terminaison des echappements 53 
terminal pour les entrees/sorties de 

debogage 491 
terminer 

processus 696 
ternaire, operateur 75 

?: comme 91, 110 

surcharge, ne fonctionne pas avec 320 
test d'entachement 964 
test de la sous-classe vide 977 
test de sous-classe vide 295 
test, commande (Unix) 17 
Test, module 829 
test.pl 503, 506 
Test::Harness, module 829 
tester 

les donnees marquees 529 
tester des modules 523 

par de gentils volontaires 524 

pour l'installation 523 
tests de fichiers 25, 85-87, 404 

portabilite de 588 

situations de concurrence avec les 539 
voir operateurs de test de fichier 

tests sur fichier 967 

Text::Abbrev, module 820 

Text::ParseWords, module 820 

Text::Warp, module 820 

texte 

capacite de Perl pour en traiter 123 
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donnees pod, convertir en format 

ASCII 827 
modules Perl pour le 518, 820 
portee lexicale et 46 
reorganisation 219 

Unicode en tant que medium pour le 373 

voir aussi chaines 
texte, fichiers (operateur de test de fichiers -T) 86 
Thread, module 420-425 

ceder la priorite au processeur 424 

creation de thread 421 

destruction de thread 422 

identifier les threads 424 

join, methode, capturer des exceptions 
depuis 423 

Thread, module 

detach, methode, arreter des threads 
avec 423 
Thread::Queue, module 431 
Thread::Semaphore, module 420, 430, 432 
Thread::Signal, module 433 
threads 417-433, 701 

attributs locked et method 315 

modele de processus 418 

modele de thread 419-433 
acces aux donnees 425-433 

multiples, dans un seul interpreteur 445 

verrouiller 701 
threads, objets 424 
tid, methode (Thread, module) 424 
tie, fonction 335, 770 

bless et 336 

DBM, fichiers et 393 

exemple d'utilisation 243, 838 

modules CPAN pour 368 

piege de deliement avec 366 

portabilite de 591 

use ou require et 337 

voir tied 

voir aussi lier des variables 
tie, modules sur CPAN 368-369 
Tie::Array, module 344 

utilisation du sous-programme SPLICE 348 
Tie::Counter, module 342 
Tie::DBI, module 368 
Tie::DevNull, module 364 
Tie::DevRandom, module 364 
Tie::Hash, module 349 
Tie::Persistent, module 369 
Tie::RefHash, module 826 
Tie::Scalar, module 338, 826 
Tie::SecureHash, module 314, 369 
Tie::StdArray, module 344 
Tie::STDERR, module 369 
Tie::StdHash, module 349 
Tie::StdScalar, module 338 



Tie::SubstrHash, module 826 
Tie::Syslog, module 369 
Tie::Tee, module 364 
Tie::TextDir, module 369 
Tie::TransactHash, module 369 
Tie::VecArray, module 369 
Tie::Watch, module 369 
tied, fonction 336, 772 

exemple d'utilisation 353 

voir tie 
tilde (~) 

voir tilde dans les symboles 
time, fonction 772,820 

convertir en champs 690, 700 

portabilite de 593 

voir gmtime 

voir localtime 

voir utime 
Time::gmtime, module 823 
Time::HiRes, module 649 
Time::localtime, module 823 
Time::tm, module 823 
timelocal, sous-programme 700 
times, fonction 772 

portabilite de 588 
Tk 488 

voir Perl/Tk 
tokenisation 

voir lexicale, analyse 
tokens 438 

analyser du texte dans une liste de 820 

caracteres ambigus, problemes avec 84 
tr/// (traduction), operateur 773, 785 

caracteres, traduire avec 379 
tr/// (transliteration), operateur 127, 138-141 

=~ et !~, operateurs de liaison 128 

modificateurs pour 130 
tracer dans le debogueur 477, 481 
traduction 

entre les langages de programmation 585 
traitement d'en-tete de page 630 
traiter des commandes shell 456 
tranches 45 

affectation des 59 

de hachages, exemple d'utilisation 802 

de tableaux 

bourdes avec les 555 
exemple d'utilisation 64, 91 
syntaxe 80 

de tableaux multidimensionnels 248 

fleches et dereferencement 232 

initialisation avec 83 

interpolation de 53, 634 

local et 115, 120 

references et 235 
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transformation en chaines (stringification) 

modules pour la 838 
translitteration 773, 785 

voir tr/// 
transtypage (en C) 96 
tri 

des clefs et valeurs, hachages 695 
hachages 258 
listes 747 
surcharge et 326 

tableaux dans des hachages de tableaux 253 
trigonometrie avec Math::Trig 820 
troff 977 
troncation 

tableaux 65 
tronquer 978 

des nombres 693 

liste d'arguments 490 
truncate, fonction 773 

portability de 588 
try, bloc 669 
tty 403 

tube a deux bouts, ouverture avec un handle de 

fichier lie 362 
tubes nommes 978 
tuer 

voir terminer 
typage 

chaines et 50 

types de donnees 977 
typage des variables 

conversion entre types 50 

scalaires 50 
typedefs (langage C) 500, 978 
typeglobs 5, 47, 67, 221, 237 

afficher le contenu des 490 

alias de table de symboles avec 272 

anonymes 228 

generer avec le module Symbol 820 

autovivification de 356 

contre les references de typeglobs 227 

creation de references a des handles de 
fichier 227 

dans les hachages de tables de symboles 270 

IO::Handle (objet) 228 

local, fonction, utiliser avec 700 

sous-programmes, resolution jusqu'a 286 

symbole de prototype (*) 6 

variables, liaison a une classe via 336 
typemap 503 
types de donnees 5 

convertir entre C et Perl 511 

internes 43^15 

internes, Perl et C 500 

scalaires 

voir scalaires 



TYPE, declarations en Perl 705 
typeglobs 67 



-u (core dump), option de la ligne de 

commande 469 
-U (dangereuses), option de la ligne de 

commande 469 
-u (setuid), test de fichier 85 
\u, echappement 135 
uc, fonction 379, 773 

exemple d'utilisation 313, 357, 844 

trier avec 748 
ucfirst, fonction 379, 773 

exemple d'utilisation 305, 869 
UDP 978 

exemple d'utilisation 415 

paquets 409 

passage de messages avec 415 
sockets et 409 
TCP ou 415 
UID 

reel ($REAL_USER_ID) 

voir dollar, $< et $> dans les symboles 
UID (user ID) 656 

effectif ($EFFECTI VE_USER_ID) 

voir dollar, $< et $> dans les symboles 

entree dans le fichier passwd 688 

reel ($REAL_USER_ID) 627, 638 
uid, etstat 758 
umask, fonction 774,978 

exemple d'utilisation 535 

mkdiret 702 

open et 710 

portabilite de 588 

sysopen et 766 
unaires, operateurs 75-96 

distinction d'avec les operateurs de liste 84 

fonctions se comportant comme 77 

identifier d'un coup d'oeil 556 

ideographiques 80 

nommes 78, 83-85 
liste de 83 

prototypage de fonctions comme 209 

surcharge 320 
undef (valeur) 64, 662 

select et 405, 741 

voir defined 
undef, fonction 565, 775 

efficacite de 566 

exemple d'utilisation 664 

gober de fichiers avec $/ et 263 

gober des fichiers avec $/ et 632 

hachages et 696 

tableaux, liberer la memoire des 65 
voir aussi valeur undef 
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Unicode 42, 373-381 

caractere separateur de ligne 43 
caractere separateur de paragraphe 43 
casse de titre, conversion des chaines en 140 
casse, tables de traduction de 379 
convertir en caracteres 657 
dans les identificateurs 47 
editeurs pour 377 
informations au sujet de 150 
locales et 697 

metacaracteres joker, detection avec 147 
proprietes 148, 150-157 

composites Perl 151 

decomposition de caracteres 152 

proprietes de bloc 154 

raccourcis de classes de caracteres Perl 
et 149 

rendu bidirectionnel 153 

standard 151 

syllabaires, classification par son de 
voyelle 154 
proprietes, base de donnees des 379 
resume de, acceder a un 380 
smiley 52, 657 

support de, basculement vers 822 
Unicode Standard, Version 3.0 380 
utilisation en Perl, precautions sur 380 
\w (mot) metacaractere et 33 

unite de compilation 48 

unites de compilation 978 

UNIVERSAL, classe 299-301, 826 
methodes, ajout 301 

Unix 6, 978 
#! et 16 

accolades dans 242 
bogues de securite 537 
caractere fin de ligne sous 651 
chemins dans 469 
chemins de fichiers sur 590 
commande test, scripts de test et 17 
date et heure sur 772 
descripteurs de fichiers sur 677 
emulation sur Windows 830 
eof (fin de fichier) sur 584 
fonctions en Perl 648 
fork sur 679 
glob de fichiers sur 821 
installer Perl sur xix 
invocation de Perl et 455 
IPCet 383 

isoler (quoting) sur 459 
la ligne de commande xxvi 
les ancetres de Perl et xiii 
modules de CPAN, installer sur 520 
permissions 774 



sauts de ligne sur 588, 714 
shells 6 

signaux et 387, 389 
sockets et 409, 823 

supplanter des fonctions pour emuler 281 

tronquer Interpretation par le noyau de la 
ligne #! 456 
Unix, systeme d'exploitation 

File::Spec::Unix, module 821 
unless, instruction 27, 98 

instruction if contre 100 
unlink, fonction 775 

exemple d'utilisation 61, 353 

portabilite de 591 

Socket, module et 863 
unpack, fonction 589, 718, 776 

des champs de longueur fixe, utilisation 
avec 952 

efficacite de 563 

exemple d'utilisation 661, 694, 716, 757, 
764, 777 

longueur de chaine et 379 

ordre de octets et 589 

portabilite de 568 

UTF-8et 379 

vecet 782 

voir pack 
unshift, fonction 245, 744, 777 

exemple d'utilisation 607, 644, 699 

splice et 751 

voir push 

voir shift 
unsigned shorts 756 
untie, fonction 335, 367, 661, 778 

exemple d'utilisation 394, 770 

references restantes, n'elimine pas 337 
until, boucles 98, 101 

up, methode (Thread::Semaphore, module) 432 

upcase, fonction 200 

use 13, 112, 113, 120, 266, 276, 500 

fonction tie et 337 

portee globale et lexicale de 114 

voir aussi modules ; pragmas 
use, fonction 

voir require 
Usenet 

groupe d'utilisateurs de Perl xxiv 

modules Perl pour 519 
user ID 

voir UID 
User::grent, module 682, 823 
User::pwent, module 688, 823 

Class::Struct, utiliser pour creer des objets et 
des accesseurs 835 
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UTF-8 42, 149, 374, 374-381 

binmode et 650 

CGI, scripts et 547 

convertir depuis/vers des octets 376 

convertir en 
voir expat 

convertir vers des entiers 379 

detection de caracteres 144 

disciplines d'entrees/sorties et 807 

efficacite de 563 

la figure smiley et 58 

ouutfiS 375 

portability de 568,590 

voir aussi utf8 pragma 
utf8, pragma 147, 150, 377, 641, 822 

exemple d'utilisation 156 

locales et 158 

voir aussi UTF-8 
utilisateur root 975 
utilisateurs 

accorder des privileges limites aux 526 

authentifier 

modules Perl pour 518 

groupes 

voir aussi GID ; groupes 

groupes d'utilisateurs 960 

recherches d'informations sur 647 

temps CPU 772 
utilitaire grep 32, 960 
utime, fonction 780 

portability de 588 

voir time 
utmp, fichier 

iw'r/etc/utmp 
UV (valeur entiere non-signee interne) 500 



-V (version), option de la ligne de 

commande 469 
-v (version), option de la ligne de 

commande 469 
v-chaines (vecteur ou version) 58, 979 

dans$ A V 637 
vaisseau spatial (<=>), operateur 88 
valeur par defaut 955 
valeur true 978 
valeur undef 26, 60 

voir aussi undef, fonction 
valeur vrai 

evaluation a l'aide de if et unless 27 
valeurs 

hachages, trier 695 

indefinie, valeur booleenne 26 

indefinies 775 

modifier en copiant 956 



referencer 223 

restreindre a une portee 115 

scalaires 

voir scalaires, valeurs 

tableau 

voir tableaux 

vs. variables 5 
valeurs false 958 
valeurs temporaires 44 
valeurs veritables, detecter avec la fonction 

defined 662 
valeurs vraies 

evaluation 26 
values, fonction 668, 780 

hachages lies et 349, 354 

voir each 

voir keys 

variable d'environnement PATH 16 
variable numerotee 623 
variable, taille de caractere 

voir UTF-8 
variables 45, 77, 229 

affichage dans le debogueur avec V 270 

anonyme 224 

attacher avec tie 770 

attributs, consulter et positionner 825 

B::Xref, module, references croisees avec du 
C 449 

condition, variables de 430 
de classe 315 

de controle dans les boucles foreach 103 
debogueur, personnaliser 488 
declaration 97, 114 

globales 118 

lexicales 116 
en Perl ou en C, noms des 557 
environnement 627 
format 216 
global 

voir global 
hachage 66 

voir hachages 
initialisation avant l'appel de sous- 
programmes 203 
interpolation 

voir interpolation de variables 
liaison 335-369 

hachages 349-355 

handles de fichier 355-366 

piege de deliement 366-368 

scalaires 337-344 

tableaux 344-349 
locales 

voir local, declarations 
marquage et 527 
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modules, exportation vers les 
programmes 278 

my 

voir my 
noms de 5, 572 
our 

voir our, declarations 
paquetage 48, 267 

afficher 482 

memoire, usage 490 
pleinement qualifiers, y acceder hors du 

paquetage 545 
portee lexicale 704 

portee, utilisation du pragma strict avec 

les 13 
privees 

voir local 

programmer en shell ou en Perl 557 
relier aux paquetages 778 
rendre locales 699 
scalaires 

entre Poperateur angle 71 

voir scalaires 
speciales 622 
statiques (en C/C++) 202 
substitutions a repetition sur 137 
tableau 

voir tableaux 
temoins, placer sur 369 
traduction avec 140 
utiliser comme motif vis-a-vis de chaines 

connues 172 
valeurs, affectation et 22 
voir aussi types de donnees 
vs. valeurs 5 
voir aussi references 
variables d'environnement 979 

modules, utilisation par Perl de 473 
PERL_DESTRUCT_LEVEL 304 
PERLDB_OPTS, positionner les options du 

debogueur avec 491 
variables de decrementation 955 
variables de paquetage 48, 49 
declarer 716 

emballage d'une declaration dans la portee 
d'unbloc 317 

stockage de donnees de classe dans les 316 

threads, aucune protection dans les 425 

voir globales, variables 
variables lexicales 114, 216, 979 

a portee de fichier, stockage de sous- 
programme anonyme dans 303 

acces depuis des fonctions 202 

persistence a travers les appels de 
fonction 202 



references symboliques et 241 

typee 963 
variadiques, fonctions en Perl 199 
variations grammaticales dans du texte 

modules Perl pour les 518 
vars, pragma (obsolete) 814, 826 
vec, fonction 781 

efficacite de 566 

exemple d'utilisation 415, 740 

longueur de chaine et 379 
vecteur de bits, interface de tableau sur un 369 
verbes 14 

paquetages, gestion des 13 
verbosite 

des avertissements 826 
verifications d'acces, specification dans le 

constructeur 313 
verifier le marquage 527 
verrou mortel dans les threads 427 
verrouiller des fichiers 390 

DBM, fichiers 393 

dissoudre les verrous en fermant les 
fichiers 392 

fichiers DBM 662 

flock, fonction 677 

verrous partages et exclusifs 391 
verrouiller des methodes 429 
VERSION, methode 300 
versions de Perl 635 

determiner avec $ A V 637 

modifications entre Perl 4 et 5 558-560 

module, verification de 280 

placer dans la ligne #! 457 

specifier 460 

vi 

implementation pour le debogueur 487 
vidage automatique des buffer 976 
vidage de fichiers 710 
vidage du tampon 979 

avec pipe 724 

dans IPC::Open2 856 

de commande 636 

par bloc 636 

par ligne 636 

pipes bidirectionnels, problemes avec 402 
tampons non vides dans les versions de 
Perl 678 

un seul caractere en entree et 681, 860 
vide, contexte 571, 783 

reconnaitre dans le debogueur 477 
video 

modules Perl pour la 520 
vider un hachage 353 
virgule (,) 

voir virgule dans les symboles 
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virgule flottante, nombres 721 
rand, fonction, renvoyant 728 
stockage par Pordinateur, ordre 589 

vision peripherique 183 

vitesse 

voir efficacite ; performance 
VMS, systeme d'exploitation 

File::Spec::VMS, module 821 

invoquer des applications Perl avec 458 
voir aussi mots simples 
voyelles, tri de syllabaires selon 154 
VRML 

modules Perl pour 519 

w 

-w (accessible en ecriture par son uid/gid), test 25 
-W (avertissements), option de la ligne de 

commande 470 
-w (avertissements), option de la ligne de 

commande 116, 121, 470, 629, 871 
-w (modifiable par Puid/gid effectif), test de 

fichier 85 

-W (modifiable par Puid/gid reel), test de 

fichier 85 
\w (mot), metacaractere 144 

correspondre a des ideogrammes avec 378 
\W (non mot), metacaractere 144 
wait, fonction 782 

$? et 625 

dieet 658 

forket 679 

portabilite de 588 

voir waitpid 

zombies, processus et 387 
waitpid, fonction 782 
close et 658 

exemple d'utilisation 394, 403, 724, 859 

IPC::Open2et 402 

IPC::Open2 ou 856 

IPC::Open3et 856 

portabilite de 588 

processus zombies et 782 

voir wait 

zombies, processus et 387 
wantarray, fonction 60, 201, 783 

exemple d'utilisation 201, 401, 775 
warn, fonction 783 

CGI, scripts et 834 

exemple d'utilisation 108 

numeros de lignes et 584 

voir Carp, module 
warn, routine 800 
_WARN__, routine 639-640 

exemple d'utilisation 784 
$WARNING 641 



${ A WARNING_BITS} 641 

warnings, pragma 121, 475, 569, 815, 827 

WARN et 639 

voir aussi avertissements lexicaux 
warnLevel, option du debogueur 488 
WeakRef, module 304 
web xiv 

info sur le chameau xxvii 

modules Perl pour le 519, 824 

sites Perl xxiv 

voir aussi CGI 

voir aussi HTML 

voir aussi HTTP 

voir aussi mod_Perl 
while, boucles 98, 101 

eof, fonction dans 668 
wide-characters 

voir larges, API de caracteres 
${ A WIDE_SYSTEM_CALLS} 641 
Win32::ChangeNotify, module 830 
Win32::Console, module 830 
Win32::Event, module 830 
Win32::EventLog, module 830 
Win32::File, module 830 
Win32::FileSecurity, module 830 
Win32::Internet, module 830 
Win32::IPC, module 830 
Win32::Mutex, module 830 
Win32::NetAdmin, module 830 
Win32::NetResource, module 830 
Win32::ODBC, module 830 
Win32::OLE, module 830 
Win32::OLE::Const, module 830 
Win32::OLE::Enum, module 830 
Win32::OLE::NLS, module 830 
Win32::OLE::Variant, module 830 
Win32::PerfLib, module 830 
Win32::Pipe, module 404 
Win32::Process, module 830 
Win32::Semaphore, module 830 
Win32::Service, module 830 
Win32::Sound, module 830 
Win32::TieRegistry, module 335, 830 
Win32API::File 831 
Win32API::Net 831 
Win32API::Registry 831 
Windows 

voir Microsoft Windows 
World Wide Web 

voir web 
wrapper 957 

write, fonction 213, 214, 784 
$%et 630 
$-et 629 
$=et 629 
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$ A A et 624, 680 
$ A Let 629 
$| et 636 

exemple d'utilisation 680 
formline et 680 
i, option 

-i, option et 463 
lignes d'images et 680 
longueur de chaine et 379 
pieds de page et 218 
select et 739 
voir format 



-X (avertissements, deactivation), option de la 

ligne de commande 471 
-x (executable par Puid/gid effectif), test de 

fichier 85 

-X (executable par Puid/gid reel), test de 

fichier 85 
-x (extraction), option de la ligne de 

commande 470 
x (repetition), operateur 20 
x extraire 

-x (extraire le programme), options de la 
ligne de commande 456 
\X, metasymbole joker 147, 378 
/x, modificateur de motif 130, 131, 134, 136 
x, operateur de repetition 82 
x=, operateur de repetition et affectation 93 
XML 



modules Perl pour 518 
xor, operateur logique 23, 88, 95 
XS, langage 

code, portabilite du 592 

fonctions, faire correspondre entre C et 
Perl 501 

sous-programmes externes, envelopper 501 
XSLoader, module 829 
XSUB 

entrees et sorties 506 

envelopper des sous-programmes pour 
Perl 501 

voir XS, langage 
xsubpp, compilateur 501 

Y 

ylll (traduction), operateur 785 

y///, operateur de transliteration 127, 138 

yield, fonction (Thread, module) 424 

z 

A Z (Ctrl-Z) pour eof 584 

\Z (limite de chame), metacaractere 161 

\z (limite de chaine), metacaractere 161 

-z (taille nulle), test de fichier 85 

zip 

voir compression 
zombies, processus 387 
fossoyer 

fork de serveurs et 414 
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Tom est implique dans le developpement de Perl depuis 1987. II est l'auteur de The Perl 
Cookbook, (Perl en action) et co-auteur de Learning Perl, (Introduction a Perl) et de Lear- 
ning Perl on Win32 Systems. 

Tom presente des seminaires annuels bases sur plus de quinze ans d'experience d'admi- 
nistration systeme et de programmation UNIX. Vivant dans les collines de Boulder, Co- 
lorado, environne de daims, de mouffettes et a l'occasion de pumas et d'ours bruns, il 
passe tous les etes a faire des excursions, tailler des arbres, elever des oiseaux, faire de la 
musique et chasser. 

Jon Orwant est le CTO d'O'Reilly & Associates et il est editeur en chef de The Perl Jour- 
nal. II est aussi co-auteur de Mastering Algorithms with Perl (O'Reilly) et auteur de Perl 5 
Interactive Course (Macmillan). Avant de rejoindre O'Reilly, il etait membre du groupe 
groupe d'edition electronique a MIT Media Lab. II a alors effectue des recherches sur le 
comportement d'utilisateurs, l'automatisation du jeu de programmation et des nouvel- 
les et divertissements personnalises generes par ordinateur. Jon travaille egalement 
avec les comites consultatifs de VerticalSearch.com, Focalex, Inc. et YourCompass, inc. 

Jon participe souvent a des conferences, parlant de manifestations comme celles de pro- 
grammeurs ou de journalistes. II prend plaisir a ecrire du code comme de la prose et ses 
trois vices sont le jeu, le vin et les mathematiques. II a egalement cree le premier jeu sur 
l'lnternet. 



A propos des traducteurs 



Philippe Bruhat, consultant specialise en securite des reseaux, programme en Perl de- 
puis 1996. II fait partie des Mongueurs de Perl depuis les tous debuts du groupe parisien 
en 1999 et est vice-president de Fassociation eponyme fondee en 2001. II est bien connu 
dans la communaute Perl pour ses exercices de programmation assombrie (qu'il consi- 
dere comme une forme d'expression artistique). 

Kai Carver, ingenieur logiciel base aux Etats-Unis et en France, travaille dans les domai- 
nes de l'informatique linguistique, d'Internet et des bases de donnees. Mongueur Perl 
parisien, il collabore regulierement avec O'Reilly. 

Gerald Sedrati a travaille pendant 6 ans chez Bull dans le developpement de logiciels 
concernant l'administration de systemes, reseaux et applications. Actuellement, ses ta- 
lents sont employes par Xyleme, startup issue de chercheurs de 1'INRIA, qui developpe 
et met en service un moteur de recherche reposant sur XML. 

II a commence a pratiquer le developpement en Perl il y a pres de cinq ans qui, depuis, 
est devenu son langage informatique de predilection ; il en apprecie enormement, en- 
tre autres, le souci linguistique dans lequel il a ete concu. 

Gerald est tres attache a la philosophic du Logiciel Libre qui rejoint quelques-unes de 
ses autres preoccupations extra-informatiques comme l'engagement aupres d' associa- 
tions comme Attac qui lutte pour qu'une « autre mondialisation soit possible ». 

II a egalement publie un recueil de poemes, intitule « Embryon ». 



